近日,据月之暗面报道,OpenAI发布了一项令人瞩目的研究报告。报告指出,DeepSeek和Kimi两个研究团队通过独立研究,成功利用思维链学习方法,在数学解题与编程挑战中显著提升了模型的综合表现。
Kimi团队的研究员Flood Sung在社交媒体上发文,分享了团队的研究心得。他提到,长思维链的有效性在团队内部已经得到了验证。在实际训练过程中,研究人员发现模型的表现会随着训练的深入而不断提升,并且token数也在不断增加。这一发现证明了在强化训练过程中,模型具备自我涌现的能力,能够不断挖掘和发挥自身的潜力。
值得一提的是,就在1月20日,DeepSeek和Kimi两个团队在同一天发布了各自的推理模型R1和k1.5。这一巧合不仅展示了两个团队在研究领域的默契,也进一步凸显了思维链学习方法在提升模型性能方面的巨大潜力。
OpenAI的这一研究报告,不仅揭示了DeepSeek和Kimi两个团队在思维链学习方法上的突破,也为人工智能领域的研究提供了新的思路和启示。
-
人工智能
+关注
关注
1813文章
49752浏览量
261636 -
模型
+关注
关注
1文章
3649浏览量
51719 -
OpenAI
+关注
关注
9文章
1238浏览量
9817 -
DeepSeek
+关注
关注
2文章
824浏览量
2824
发布评论请先 登录
【「DeepSeek 核心技术揭秘」阅读体验】+混合专家
【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘
DeepSeek开源新版R1 媲美OpenAI o3
DeepSeek与Kimi揭示o1秘密,思维链学习方法显成效
OpenAI O3与DeepSeek R1:推理模型性能深度分析
了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择
PerfXCloud上线DeepSeek系列模型
AI模型思维链功能升级,提升透明度与可信度
芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!
中国2家AI公司连发新模型赶超OpenAI
对标OpenAI o1,DeepSeek-R1发布
赶紧在本地运行与OpenAI-o1能力近似的DeepSeek-R1模型

OpenAI:DeepSeek与Kimi揭秘o1,长思维链提升模型表现
评论