0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek与Kimi揭示o1秘密,思维链学习方法显成效

科技绿洲 来源:网络整理 作者:网络整理 2025-02-18 15:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据消息,OpenAI近日发布了一项重要研究报告。报告指出,DeepSeek和Kimi两家机构通过独立研究,成功利用思维链学习方法,在数学解题与编程挑战中显著提升了模型的综合表现。

Kimi的研究员Flood Sung在随后的发文中详细阐述了这一发现。他提到,长思维链的有效性在内部实验中已经得到了验证。在实际训练过程中,研究人员发现模型的表现会随着训练的深入而不断提升,并且token数也在不断增加。这一现象表明,在强化训练的过程中,模型能够自我涌现,进一步提升其解题能力。

值得注意的是,就在1月20日,DeepSeek和Kimi在同一天发布了各自的推理模型R1和k1.5。这两款模型的发布,无疑是对其研究成果的进一步验证和展示。

此次DeepSeek与Kimi的研究不仅揭示了o1的秘密,更为人工智能领域的发展带来了新的启示。思维链学习方法的成功应用,为提升AI模型的解题能力和编程能力提供了新的思路和方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50317

    浏览量

    266894
  • 模型
    +关注

    关注

    1

    文章

    3817

    浏览量

    52265
  • Kimi
    +关注

    关注

    0

    文章

    14

    浏览量

    338
  • DeepSeek
    +关注

    关注

    2

    文章

    838

    浏览量

    3396
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    月之暗面发布官方编程工具Kimi Code

    月之暗面已正式发布 Kimi 的编程工具:Kimi Code。
    的头像 发表于 01-29 10:23 1470次阅读
    月之暗面发布官方编程工具<b class='flag-5'>Kimi</b> Code

    速看!EASY-EAI教你离线部署Deepseek R1大模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型。DeepSeek-R1采用强化学习
    的头像 发表于 07-25 15:22 1575次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> R<b class='flag-5'>1</b>大模型

    ARM入门学习方法分享

    。 以下是一些入门学习方法的分享: 一、 理解基本概念:首先,了解ARM是什么以及它的基本概念是很重要的。ARM(Advanced RISC Machines)指的是一种精简指令集计算机(RISC
    发表于 07-23 10:21

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    感谢电子发烧友提供学习Deepseek核心技术这本书的机会。 读完《Deepseek核心技术揭秘》,我深受触动,对人工智能领域有了全新的认识。了解Deepseek-R1
    发表于 07-22 22:14

    【「DeepSeek 核心技术揭秘」阅读体验】--全书概览

    讲解Deepseek的使用方法 第三章 深入剖析Deepseek-V3的模型架构、训练框架、推理阶段优化、后训练优化等关键技术 第四章关于DeepSeek-R1的技术剖析 第五章 从
    发表于 07-21 00:04

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    ,并同步开源了 模型权重。DeepSeek-R1是基于DeepSeek-V3基座模型开发的,专门针对高级推理任务进行 了优化。该模型在后训练阶段大规模使用强化学习技术,通过创新的训练方法
    发表于 07-17 11:59

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    DeepSeek-R1-Zero 的核心创新之一是采用 纯强化学习 (Reinforcement Learning,RL)进行训练。这一方法颠覆了传统的依赖有监督微调(Supervised
    发表于 06-09 14:38

    DeepSeeK学习资料

    104页DeepSeeK学习资料(清华)
    发表于 06-08 09:57 3次下载

    DeepSeek开源新版R1 媲美OpenAI o3

    ;还有一些网友的实测评价都显示, DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性价比的平替。 此外,关于DeepSeek的R2大模型的传闻也很多
    的头像 发表于 05-29 11:23 1488次阅读

    小米玄戒O1 vs 苹果A18 全面对比分析

    小米玄戒O1 vs 苹果A18 全面对比分析 一、技术架构与工艺制程 维度 小米玄戒O1 苹果A18 制程工艺 台积电第二代3nm(N3E) 台积电3nm(N3E) CPU架构 十核四丛集设计:2
    的头像 发表于 05-23 15:20 2890次阅读

    今日看点丨小米爆料:玄戒芯片不止O1一款;消息称一汽南京全员解散,赔偿 N+4

    1. 小米卢伟冰爆猛料:玄戒芯片不止O1 一款   5月21日晚,小米发布会进行最后一次彩排,小米集团总裁卢伟冰爆料,玄戒芯片不止O1一款。目前小米只预热了玄戒O1芯片,这颗芯片将由小
    发表于 05-22 11:34 3819次阅读

    雷军:小米玄戒O1已开始大规模量产

    雷军今日又爆出大消息,雷军在微博宣布,由小米自主研发设计的3nm旗舰芯片玄戒O1已开启大规模量产。 据悉,玄戒O1芯片为“1+3+4”八核三丛集架构,玄戒O1包含
    的头像 发表于 05-20 14:37 1235次阅读

    小米自研芯片玄戒O1跑分出炉 单核2709多核8125 小米联想加速“造芯”

    小米芯片玄戒O1(XRING O1)是小米自主研发设计的手机SoC芯片,预计将于2025年5月下旬发布。目前从媒体爆出的消息来看;小米玄戒O1芯片或采用“1+3+4”八核三丛集设计,还
    的头像 发表于 05-19 09:47 2685次阅读

    今日看点丨小米自研手机 SoC 芯片“玄戒 O1”官宣;曝特斯拉重启中国零部件进口

    1. 自研SoC 芯片玄戒O1 突然官宣!雷军:小米十年造芯路始于2014 年   5月15日晚,雷军突然宣布了小米自研手机SoC芯片命名“玄戒O1”,将于5月下旬发布。雷军表示:“小米十年造芯路
    发表于 05-16 11:16 1775次阅读

    雷军官宣小米造芯 雷军宣布小米芯片进展 手机SoC芯片玄戒O1于5月下旬发布

    小米造芯终于实锤了,小米官方已经确认。小米芯片玄戒O1(XRING O1)是小米自主研发设计的手机SoC芯片,预计将于2025年5月下旬发布。目前玄戒O1的制程工艺、性能参数等详细信息尚未公布,但是
    的头像 发表于 05-16 10:22 1897次阅读