0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI:DeepSeek与Kimi揭秘o1,长思维链提升模型表现

科技绿洲 来源:网络整理 作者:网络整理 2025-02-18 09:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,据月之暗面报道,OpenAI发布了一项令人瞩目的研究报告。报告指出,DeepSeek和Kimi两个研究团队通过独立研究,成功利用思维链学习方法,在数学解题与编程挑战中显著提升了模型的综合表现。

Kimi团队的研究员Flood Sung在社交媒体上发文,分享了团队的研究心得。他提到,长思维链的有效性在团队内部已经得到了验证。在实际训练过程中,研究人员发现模型的表现会随着训练的深入而不断提升,并且token数也在不断增加。这一发现证明了在强化训练过程中,模型具备自我涌现的能力,能够不断挖掘和发挥自身的潜力。

值得一提的是,就在1月20日,DeepSeek和Kimi两个团队在同一天发布了各自的推理模型R1和k1.5。这一巧合不仅展示了两个团队在研究领域的默契,也进一步凸显了思维链学习方法在提升模型性能方面的巨大潜力。

OpenAI的这一研究报告,不仅揭示了DeepSeek和Kimi两个团队在思维链学习方法上的突破,也为人工智能领域的研究提供了新的思路和启示。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261636
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9817
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2824
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    感谢电子发烧友提供学习Deepseek核心技术这本书的机会。 读完《Deepseek核心技术揭秘》,我深受触动,对人工智能领域有了全新的认识。了解Deepseek-R1
    发表于 07-22 22:14

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    ,仅凭极少标注数据便大幅提升模型的推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1 的效果已可比肩 OpenAI-o1 正式版。
    发表于 06-09 14:38

    DeepSeek开源新版R1 媲美OpenAI o3

    ;还有一些网友的实测评价都显示, DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性价比的平替。 此外,
    的头像 发表于 05-29 11:23 741次阅读

    DeepSeekKimi揭示o1秘密,思维学习方法显成效

    据消息,OpenAI近日发布了一项重要研究报告。报告指出,DeepSeekKimi两家机构通过独立研究,成功利用思维学习方法,在数学解题
    的头像 发表于 02-18 15:13 696次阅读

    OpenAI O3与DeepSeek R1:推理模型性能深度分析

    OpenAI刚推出的O3和DeepSeek的R1代表了推理模型领域的重大进步。这两种模型都因在各
    的头像 发表于 02-18 11:07 1310次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实
    发表于 02-14 02:08

    PerfXCloud上线DeepSeek系列模型

    零门槛体验DeepSeek-R1满血版本,性能对标OpenAI o1,即刻开启一场震撼人心的AI探索之旅。
    的头像 发表于 02-10 10:20 3915次阅读

    AI模型思维功能升级,提升透明度与可信度

    据外媒最新报道,OpenAI近期对其o3-mini AI模型进行了重要更新,引入了备受瞩目的“思维”功能。这一创新之举使得用户能够直观地观
    的头像 发表于 02-10 09:06 790次阅读

    OpenAI o3-mini模型思维遭质疑

    近日,OpenAI公开了其大模型o3-mini的推理思维,这一举措使得免费用户和付费用户都能深入了解
    的头像 发表于 02-08 10:57 915次阅读

    芯动力神速适配DeepSeek-R1模型,AI芯片设计迈入“快车道”!

    DeepSeek研发的系列推理模型,自诞生起就备受瞩目。它采用强化学习训练,推理时包含大量反思和验证,思维链长度可达数万字。在数学、代码以及复杂逻辑推理任务上,DeepSeek-R1
    的头像 发表于 02-07 16:55 905次阅读
    芯动力神速适配<b class='flag-5'>DeepSeek-R1</b>大<b class='flag-5'>模型</b>,AI芯片设计迈入“快车道”!

    中国2家AI公司连发新模型赶超OpenAI

    日前,月之暗面(Kimi)和深度求索(DeepSeek)陆续发布了最新模型,而且都在性能测试中超过OpenAIo1正式版
    的头像 发表于 01-23 17:00 1177次阅读

    国产AI卷翻硅谷,奥特曼发文“阴阳”,类o1模型都在卷什么?

    比肩o1Kimi新论文中透露的RL方法论和AI大变局
    的头像 发表于 01-22 15:13 5371次阅读
    国产AI卷翻硅谷,奥特曼发文“阴阳”,类<b class='flag-5'>o1</b><b class='flag-5'>模型</b>都在卷什么?

    对标OpenAI o1,DeepSeek-R1发布

    DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI
    的头像 发表于 01-22 13:46 3080次阅读
    对标<b class='flag-5'>OpenAI</b> <b class='flag-5'>o1</b>,<b class='flag-5'>DeepSeek-R1</b>发布

    赶紧在本地运行与OpenAI-o1能力近似的DeepSeek-R1模型

    类似GPT4-V的能力:MiniCPM-V 2.6 》。本文将分享在本地运行能与OpenAI-o1 能力相媲美的 DeepSeek-R1  模型。 [编者注]:OpenAI-o1
    的头像 发表于 01-21 14:29 4344次阅读
    赶紧在本地运行与<b class='flag-5'>OpenAI-o1</b>能力近似的<b class='flag-5'>DeepSeek-R1</b><b class='flag-5'>模型</b>

    OpenAI发布o1模型API,成本大幅下降60%

    近日,OpenAI正式推出了备受期待的o1模型API,并对实时API进行了重大升级,引入了WebRTC支持。此次发布的o1模型API相较于之
    的头像 发表于 12-19 10:31 921次阅读