Deepseek的DeepSeek-R1大模型最近在全球范围内引起了不小的轰动,尤其是在苹果应用商店的中国区和美国区排行榜上取得了显著的成绩。1月27日,Deepseek应用登顶苹果中国区和美国区免费应用下载榜,在美区甚至超越了ChatGPT,显示出其强劲的市场表现。
文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html
美区APP Store文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html
中国区APP Store文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html
DeepSeek-R1的发布无疑是一个重要的里程碑。它凭借出色的性价比和在数学、代码、自然语言推理等任务中的强大能力,在海外开发者社区中迅速获得了关注。与OpenAI的GPT-4o模型相比,DeepSeek-R1不仅在性能上相当接近,而且预训练的成本仅为GPT-4o的不到十分之一。R1的训练成本只有557.6万美元,且使用的是2048块低配版英伟达H800 GPU,训练周期仅为55天,显示出Deepseek在大规模AI训练中的高效性。文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html
DeepSeek的另一个创新是,R1的训练完全由强化学习(RL)驱动,突破了传统的监督微调方法。这种方式不仅提高了模型的推理能力,而且使得R1在低标注数据的情况下依然表现出色。DeepSeek还将R1的技术向开源社区公开,并蒸馏出6个小模型,供开发者进一步开发和训练其他模型。文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html
英伟达高级研究科学家Jim Fan对此表示,DeepSeek-R1可能是“首个展示了强化学习飞轮作用且能带来持续增长的开源项目”。他认为,DeepSeek正在践行OpenAI最初的使命,即实现前沿技术的开放与普惠。文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html
随着DeepSeek-R1的持续进步和开源技术的推广,它在AI领域的影响力无疑会进一步扩大,也将促使更多创新者和开发者参与到全球AI技术的发展中。文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html 文章源自堕落的鱼-https://www.duoluodeyu.com/2746.html