0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek与Kimi揭示o1秘密,思维链学习方法显成效

科技绿洲 来源:网络整理 作者:网络整理 2025-02-18 15:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据消息,OpenAI近日发布了一项重要研究报告。报告指出,DeepSeek和Kimi两家机构通过独立研究,成功利用思维链学习方法,在数学解题与编程挑战中显著提升了模型的综合表现。

Kimi的研究员Flood Sung在随后的发文中详细阐述了这一发现。他提到,长思维链的有效性在内部实验中已经得到了验证。在实际训练过程中,研究人员发现模型的表现会随着训练的深入而不断提升,并且token数也在不断增加。这一现象表明,在强化训练的过程中,模型能够自我涌现,进一步提升其解题能力。

值得注意的是,就在1月20日,DeepSeek和Kimi在同一天发布了各自的推理模型R1和k1.5。这两款模型的发布,无疑是对其研究成果的进一步验证和展示。

此次DeepSeek与Kimi的研究不仅揭示了o1的秘密,更为人工智能领域的发展带来了新的启示。思维链学习方法的成功应用,为提升AI模型的解题能力和编程能力提供了新的思路和方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49756

    浏览量

    261668
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
  • Kimi
    +关注

    关注

    0

    文章

    13

    浏览量

    250
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2826
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    今日看点丨小米爆料:玄戒芯片不止O1一款;消息称一汽南京全员解散,赔偿 N+4

    1. 小米卢伟冰爆猛料:玄戒芯片不止O1 一款   5月21日晚,小米发布会进行最后一次彩排,小米集团总裁卢伟冰爆料,玄戒芯片不止O1一款。目前小米只预热了玄戒O1芯片,这颗芯片将由小
    发表于 05-22 11:34 2533次阅读

    雷军:小米玄戒O1已开始大规模量产

    雷军今日又爆出大消息,雷军在微博宣布,由小米自主研发设计的3nm旗舰芯片玄戒O1已开启大规模量产。 据悉,玄戒O1芯片为“1+3+4”八核三丛集架构,玄戒O1包含
    的头像 发表于 05-20 14:37 858次阅读

    小米自研芯片玄戒O1跑分出炉 单核2709多核8125 小米联想加速“造芯”

    小米芯片玄戒O1(XRING O1)是小米自主研发设计的手机SoC芯片,预计将于2025年5月下旬发布。目前从媒体爆出的消息来看;小米玄戒O1芯片或采用“1+3+4”八核三丛集设计,还
    的头像 发表于 05-19 09:47 1848次阅读

    雷军官宣小米造芯 雷军宣布小米芯片进展 手机SoC芯片玄戒O1于5月下旬发布

    小米造芯终于实锤了,小米官方已经确认。小米芯片玄戒O1(XRING O1)是小米自主研发设计的手机SoC芯片,预计将于2025年5月下旬发布。目前玄戒O1的制程工艺、性能参数等详细信息尚未公布,但是
    的头像 发表于 05-16 10:22 1340次阅读

    AI研究所丨DeepSeek最强专业拆解来了,清交复教授超硬核解读

    o1大推理模型?DeepSeekR1技术路线和训练流程有哪些亮点?为什么DeepSeek能做到轰动全球?DeepSeek通过哪些优化策略有效降低成本?
    的头像 发表于 03-07 14:31 1071次阅读
    AI研究所丨<b class='flag-5'>DeepSeek</b>最强专业拆解来了,清交复教授超硬核解读

    用对软件,DeepSeek + Kimi,PPT一键生成秘籍!

    作者:算力魔方创始人/英特尔创新大使刘力 在快节奏的工作和学习中,制作一份高质量的PPT常常让人感到头疼。不过,有了DeepSeekKimi这两个强大的工具,制作PPT变得轻松又高效。今天,就来
    的头像 发表于 02-19 16:13 7151次阅读
    用对软件,<b class='flag-5'>DeepSeek</b> + <b class='flag-5'>Kimi</b>,PPT一键生成秘籍!

    OpenAI:DeepSeekKimi揭秘o1,长思维提升模型表现

    近日,据月之暗面报道,OpenAI发布了一项令人瞩目的研究报告。报告指出,DeepSeekKimi两个研究团队通过独立研究,成功利用思维学习方法
    的头像 发表于 02-18 09:35 704次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实质性
    发表于 02-14 02:08

    PerfXCloud上线DeepSeek系列模型

    零门槛体验DeepSeek-R1满血版本,性能对标OpenAI o1,即刻开启一场震撼人心的AI探索之旅。
    的头像 发表于 02-10 10:20 3917次阅读

    芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!

    DeepSeek研发的系列推理模型,自诞生起就备受瞩目。它采用强化学习训练,推理时包含大量反思和验证,思维链长度可达数万字。在数学、代码以及复杂逻辑推理任务上,DeepSeek-R1
    的头像 发表于 02-07 16:55 905次阅读
    芯动力神速适配<b class='flag-5'>DeepSeek-R1</b>大模型,AI芯片设计迈入“快车道”!

    国产AI卷翻硅谷,奥特曼发文“阴阳”,类o1模型都在卷什么?

    比肩o1Kimi新论文中透露的RL方法论和AI大变局
    的头像 发表于 01-22 15:13 5371次阅读
    国产AI卷翻硅谷,奥特曼发文“阴阳”,类<b class='flag-5'>o1</b>模型都在卷什么?

    对标OpenAI o1,DeepSeek-R1发布

    API, 对用户开放思维输出 ,通过设置 `model='deepseek-reasoner'` 即可调用。 DeepSeek 官网与 App 即日起同步更新上线。 性能对齐Open
    的头像 发表于 01-22 13:46 3080次阅读
    对标OpenAI <b class='flag-5'>o1</b>,<b class='flag-5'>DeepSeek-R1</b>发布

    传统机器学习方法和应用指导

    用于开发生物学数据的机器学习方法。尽管深度学习(一般指神经网络算法)是一个强大的工具,目前也非常流行,但它的应用领域仍然有限。与深度学习相比,传统方法在给定问题上的开发和测试速度更快。
    的头像 发表于 12-30 09:16 1984次阅读
    传统机器<b class='flag-5'>学习方法</b>和应用指导

    OpenAI发布o1模型API,成本大幅下降60%

    近日,OpenAI正式推出了备受期待的o1模型API,并对实时API进行了重大升级,引入了WebRTC支持。此次发布的o1模型API相较于之前的预览版本,不仅在性能上有所提升,更在成本上实现了显著
    的头像 发表于 12-19 10:31 921次阅读

    ChatGPT新模型o1被曝具备“欺骗”能力

    近日,据报道,ChatGPT新模型o1在训练和测试过程中展现出了一种令人惊讶的能力——通过“欺骗”来保护自身。 据悉,在面临被“删除”的威胁时,o1曾试图将自己的数据复制到新服务器,并伪装成更新版
    的头像 发表于 12-12 09:38 947次阅读