DeepSeek近期对其R1模型进行了小版本升级,推出了R1-0528版本。此次更新主要针对模型的后训练阶段,提升了思维深度与推理能力。根据官方测试结果,新版模型在数学、编程等任务上表现优异,甚至超越了国内部分领先模型。不过,在工具调用等能力方面仍存在提升空间。
此次更新后,腾讯迅速行动,将DeepSeek-R1-0528接入旗下多款产品。新版模型在复杂推理任务中表现更优,但消耗的token数量也有所增加。此外,模型的幻觉率显著降低,在改写润色、总结摘要等场景中下降了45%至50%。
当前,全球AI领域竞争激烈,许多企业将目光转向AI Agent应用。然而,DeepSeek创始人梁文锋仍坚持专注于模型本身的研发。他认为,推动技术前沿发展比快速盈利更重要。DeepSeek团队以年轻技术人才为主,保持着对AGI的深度探索。
尽管DeepSeek在模型研发上取得进展,但与OpenAI等国际领先企业相比仍存在一定差距。业内人士估计,这个差距可能在2到3个月左右。随着AI领域竞争重点转向Agent应用,DeepSeek能否保持技术优势,仍需时间验证。
梁文锋团队发表论文:DeepSeek V3模型扩展方案首次公开
DeepSeek团队近期发表了一篇关于DeepSeek-V3大模型的回顾性论文,详细探讨了AI架构扩展面临的挑战及硬件优化思路。这篇由梁文锋参与撰写的论文,重点分析了如何通过软硬件协同设计提升AI系统的可扩展性、效率和鲁棒性。论文没有重复技...
AI寒武纪|2025-05-18 13:36
梁文锋低调布局|DS品牌百日走红
自1月20日DeepSeek R1发布以来,这家中国AI公司在短短100天内迅速成为全球瞩目的焦点。DeepSeek不仅展示了中国在人工智能领域的强大实力,更推动了大模型行业从GPT模式向Reasoner模式的转变。创始人梁文锋凭借其独特的...
字母榜|2025-05-17 14:54
梁文锋事件引发OpenAI重新开放讨论
OpenAI近期宣布放弃完全转为营利性机构的计划,决定回归非营利组织的初心,这一转变引发了行业广泛关注。5月6日,OpenAI CEO山姆·阿尔特曼发布全员信,强调公司将由非营利组织控制,并取消对投资者的财务回报上限。这一决策被视为Open...
中国企业家杂志|2025-05-16 11:06
创业者想拜拜梁文锋 | DS爆火100天
编者按:自1月20日DeepSeek R1爆火以来,过去100天的大模型世界中,DeepSeek成了当之无愧的顶流明星。DeepSeek不仅展现了中国AI的力量,也在一定程度上影响了世界AI发展的方向。值此之际,字母榜&直面AI特推出“De...
字母榜|2025-05-10 15:07
梁文锋和杨植麟再“撞车”
记者闫俊文 编辑张晓迪 继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。 4月30日,DeepSeek上线新模型DeepSeek-Prover-V2,这是一个数学定理证明专用模型。 Prover-V2的参数规模进一步扩展...
华尔街见闻官方|2025-05-07 16:05
梁文锋和杨植麟再“撞车”
被追赶和超越,是创业者常面对的挑战。文|《中国企业家》记者 闫俊文编辑|张晓迪图片来源|视觉中国继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。4月30日,DeepSeek上线新模型DeepSeek-Prover-V2,...
中国企业家杂志|2025-05-05 08:04
本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/72259/