DNF辅助咨询网DNF辅助咨询网

欢迎光临
我们一直在努力

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

  

  最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

  国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

  DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

  另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

  事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

  “重大转变”!俄罗斯与北约演习!外媒:白宫首次明确表态,乌将获准坐在桌旁 乌克兰参与和平谈判

  科学家们对DeepSeek-R1表现出浓厚兴趣,这是一种价格低廉但功能强大的人工智能推理模型。自一家中国公司上周发布以来,美国股市因此出现上涨。测试表明,DeepSeek-R1在解决数学和科学问题方面与OpenAI于9月发布的o1模型相当

  以上便是DNF工具相关内容,如果对你有所帮助,记得收藏本页方便下次阅读。

  

推荐阅读:巧用云快卖打造高效跑腿服务小程序

  
推荐阅读:命运方舟韩服最新节奏玩家集体抗议!

  

未经允许不得转载:DNF辅助咨询网 » Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注
分享到: 更多 (0)

联系我们