0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【免费送书】DeepSeek 核心技术揭秘免费申请体验

电子发烧友论坛 2025-06-10 08:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2025年年初,DeepSeek成为全球人工智能AI)领域的焦点,其DeepSeek-V3和DeepSeek-R1版本在行业内引发了结构性震动。

DeepSeek-V3是一个拥有6710亿个参数的混合专家模型(MoE),每个token(模型处理文本的基本单位)激活370亿个参数。该模型在14.8万亿个高质量token上进行预训练,采用MLA和MoE架构。DeepSeek-V3的发布几乎没有预热和炒作,仅凭借其出色的效果和超低的成本迅速走红。

DeepSeek-R1则是在DeepSeek-V3的基础上构建的推理模型,它在后训练阶段大规模使用强化学习技术,仅凭极少标注数据便大幅提升了模型的推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1的效果已可比肩OpenAI-o1正式版。

ae1529ca-458e-11f0-986f-92fbcf53809c.png

DeepSeek-R1 在基准测试中的表现


DeepSeek-V3技术突破

DeepSeek-V3的模型架构整体上基于Transformer的MoE架构,并在细节实现上做了大量的创新和优化,如大量小专家模型、多头潜在注意力、无辅助损失的负载平衡、多token预测技术(MTP)等,大幅提升了模型的性能。

在模型训练方面,DeepSeek依托自研的轻量级分布式训练框架HAI-LLM,通过算法、框架和硬件的紧密配合,突破了跨节点MoE训练中的通信瓶颈,实现了高效稳定的训练。DeepSeek-V3 是业界率先使用FP8进行混合精度训练的开源模型。

在推理部署方面,DeepSeek-V3采用预填充(Prefilling)和解码(Decoding)分离的策略,以及冗余专家策略,在提高推理速度的同时确保了系统的稳定性和可靠性。

ae2d1c6a-458e-11f0-986f-92fbcf53809c.png

DeepSeek 架构图

DeepSeek-R1技术突破
01.纯强化学习训练

DeepSeek-R1-Zero的核心创新之一是采用纯强化学习(Reinforcement Learning,RL)进行训练。这一方法颠覆了传统的依赖有监督微调(Supervised Fine-Tuning,SFT)和人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)的训练模式,首次验证了无须任何SFT数据,仅通过强化学习即可实现推理能力的自主进化。

02.GRPO 算法GRPO算法是DeepSeek-R1-Zero使用的另一个重要的创新算法。与传统的强化学习算法(如PPO、DPO)不同,GRPO算法通过组内奖励对比直接优化策略网络。具体而言,GRPO 算法将同一问题生成的N条候选答案划为一组,以组内平均奖励为基线,计算相对优势值。这种方法不需要额外训练价值模型,降低了训练复杂度,提高了训练效率。ae517f56-458e-11f0-986f-92fbcf53809c.png

GRPO 与 PPO 对比示意图

03.奖励模型的创新在强化学习的训练过程中,DeepSeek研究团队选择面向结果的奖励模型,而不是通常的面向过程的奖励模型。这种方式可以较好地避免奖励欺骗,同时,由于不需要大量标注数据,可以降低训练复杂度。ae6eaee6-458e-11f0-986f-92fbcf53809c.png

结果奖励和过程奖励

“冷启动+多阶段RL”

为了解决纯强化学习训练带来的可读性差和多语言混杂等问题,DeepSeek-R1采用“冷启动+多阶段RL”的训练策略。在冷启动阶段,引入数千条高质量的长思维链数据对基础模型进行微调,强制规范输出格式,提高可读性。随后,通过两阶段强化学习进一步优化模型的性能。

推理导向RL:结合规则奖励(如答案准确性、语言一致性),优化模型在数学、编程等结构化任务中的表现。

通用对齐RL:融入人类偏好奖励模型,确保模型在开放域任务中的安全性与实用性。

  • aec6626c-458e-11f0-986f-92fbcf53809c.png

DeepSeek-R1 的训练过程



DeepSeek-R1-Zero在训练初期没有人工示范,完全靠自己摸索。就像让小孩自己解谜题,结果他居然悟出了很多强大的解题技巧!但仅靠自我摸索的 DeepSeek-R1-Zero 给出的答案有时很难读懂,甚至会中英文混杂,或者偏离人们习惯的表达方式。


因此,在训练 DeepSeek-R1 时,DeepSeek 研究团队对模型进行了两次额外的调整:第一次是喂给它一些冷启动的例子,相当于给模型打好基础,让它知道回答时的基本礼仪和清晰度;第二次是在强化学习之后,收集在训练中表现优秀的解题示例,再混合一些人工整理的题目,重新训练模型。通过这样的流程,DeepSeek-R1 就像一个经历了自学、纠错、再学习、再实战的学生,已成长为解题高手。


上述过程还揭示了一个少有人注意的基本原则,那就是要让模型自由地思考。在许多 AI实验中,模型的结构约束越少,则当计算资源增加时,最终性能的上限越高。反之,如果在早期给模型添加过多的结构约束,则它的最终表现可能会受到限制,失去了更多自主探索的可能性。在各种训练模型推理能力的范式中,基于结果奖励的强化学习给模型的约束最少。以结果为导向,用结果来激励——“Don’t teach, incentivize.”也就是说,不要去“教”模型,而要“激励”它自主探索。




《DeepSeek核心技术揭秘》是剖析DeepSeek技术原理的专业技术书,以全面的内容、深入的技术原理解析和前瞻性的行业洞察,为技术人员、研究人员和大模型相关技术爱好者提供了宝贵的学习资料

本书目录结构 第1章介绍DeepSeek的一系列技术突破与创新,如架构创新、训练优化、推理与部署优化等,让读者对DeepSeek的性能突破形成直观的认识。同时,介绍DeepSeek的模型家族,涵盖通用语言模型、多模态模型、代码生成与理解等领域,展现了DeepSeek在大模型的不同细分领域取得的成就。

第2章为初学者深入浅出地讲解DeepSeek的使用方法。从推理模型与通用模型的差异,到具体的使用案例,读者可以直观地感受DeepSeek在实际应用中的强大功能。对提示工程的详细介绍,可以帮助读者了解如何通过精心设计的提示词更好地发挥DeepSeek的能力。对提示词链的高级使用技巧的介绍,为读者进一步提升DeepSeek使用效果提供参考。

第3章和第4章是本书的核心与精华。

第3章深入剖析DeepSeek-V3的模型架构、训练框架、推理阶段优化、后训练优化等关键技术。从混合专家模型(MoE)的起源与发展,到DeepSeek-V3的MoE优化,再到对多头潜在注意力(MLA)机制和多token预测的详细解读,帮助读者全面了解DeepSeek-V3在技术上的先进性和创新性。同时,对训练框架的并行策略、FP8混合精度训练及推理阶段的优化等内容的深入分析,展示了DeepSeek在提升效率和性能方面的不懈追求。

第4章关于DeepSeek-R1的技术剖析同样精彩纷呈。预备知识的介绍为读者理解后续内容打下了坚实的基础。对DeepSeek-R1-Zero的组相对策略优化(GRPO)算法、奖励模型等关键技术的深入剖析,可以帮助读者了解DeepSeek在强化学习领域的创新性探索。对DeepSeek-R1 的训练过程和推理能力的蒸馏等内容的详细阐述,能让读者对这一创新技术的特点有全面的认知。

第5章从宏观的角度分析DeepSeek对人工智能技术格局的影响,包括打破硬件依赖迷思、冲击英伟达CUDA护城河、引发大模型技术路线的重新思考等多个方面。同时,总结了DeepSeek 成功背后的启示,如领导者敏锐的技术直觉、长期主义的坚持、极致的工程优化等,为读者提供了宝贵的经验和启示。

第6章对DeepSeek“开源周”的多个技术项目进行了深入的分析。通过对FlashMLA、DeepEP、DeepGEMM、DualPipe与EPLB、3FS等项目的介绍,展示了DeepSeek在开源领域的积极探索,体现了其推动大模型技术普及和发展的决心。这些技术项目的详细解读,能让读者了解DeepSeek在降低人工智能技术门槛、促进技术交流与合作方面的巨大贡献。

第7章对大模型的发展进行了讨论。从MoE的发展趋势、MLA的展望,大模型的训练方法、推理部署,到GPU硬件及推理模型的发展趋势,以前瞻性的视角为读者描绘了大模型的发展蓝图。

af033ffc-458e-11f0-986f-92fbcf53809c.jpgDeepSeek核心+配套视频课程

本书由一线资深技术人员编写,知识点讲解清晰。内容完全围绕DeepSeek核心技术展开,提炼精华,不讨论与DeepSeek有关的大模型基础,而是关注DeepSeek本身。

卢菁,北京科技大学博士,北京大学博士后,B站、视频号优秀科技博主。曾任职于腾讯、爱奇艺等知名互联网公司,主要从事人工智能技术的应用和研发工作,主要研究方向为大模型、多模态、自然语言处理、知识图谱、推荐系统等。著有《速通机器学习》《速通深度学习数学基础》。

戴志仕,资深AI架构师,“寒武纪人工智能”公众号的创立者。2024年CCF国际AIOps挑战赛优秀奖获得者。拥有十余年人工智能算法研究和产业落地经验,成功实施过多个人工智能项目。

申请时间

2025年6月9日——2025年7月11日

活动参与方式

1、在本帖下方留言回帖说说你想要这本书的理由15字以上。

2、我们将从本帖留言中挑选3位幸运者赠送此书籍,共赠送4本。

3、请在收到书籍后2个星期内提交不少于2篇试读报告要求300字以上图文并茂。

4、试读报告发表在电子发烧友论坛>>社区活动专版标题名称必须包含【「DeepSeek 核心技术揭秘」阅读体验】+自拟标题

注意事项

1、活动期间如有作弊、灌水等违反电子发烧友论坛规则的行为一经发现将立即取消获奖资格

2、活动结束后获奖名单将在论坛公示请活动参与者尽量完善个人信息如管理员无法联系到选中的评测者则视为自动放弃。

3、申请人收货后14天内未完成书评无权将书籍出售或转赠给他人。如无法在收货后14天内提交书评请将书籍退回电子发烧友论坛运费自理。

4、如有问题请咨询工作人员(微信:elecfans123)。


af363966-458e-11f0-986f-92fbcf53809c.png

af4633c0-458e-11f0-986f-92fbcf53809c.png

声明:本文由电子发烧友社区发布,转载请注明以上来源。如需平台(包括:试用+专栏+企业号+学院+技术直播+共建社区)合作及入群交流,请咨询18925255684(微信同号:elecfans123),谢谢!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49756

    浏览量

    261669
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2826
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    免费送】玩转高速电路:基于ANSYS HFSS的无源仿真实例

    设计师可以分成两类,一类已经遇到了信号完整性问题,另一类即将遇到信号完整性问题。申请链接>>>【书籍评测活动NO.66】玩转高速电路:基于ANSYSHFSS的无源仿真实例申请时间
    的头像 发表于 11-11 08:08 449次阅读
    【<b class='flag-5'>免费送</b><b class='flag-5'>书</b>】玩转高速电路:基于ANSYS HFSS的无源仿真实例

    【「DeepSeek 核心技术揭秘」阅读体验】+看视频+看书籍+国产开源大模型DeepSeekV3技术详解--1

    Cache 瓶颈问题。 我们将结合左侧的架构图和右侧的数学公式,一步步进行推导和解释。 1. 技术背景和核心思想 问题: 标准的 Transformer 在处理长文本时,需要缓存所有过去 token
    发表于 08-23 15:20

    免费送】AI芯片,从过去走向未来:《AI芯片:前沿技术与创新未来》

    最重大的技术变革无疑就是大模型的横空出世,人类的时间仿佛被装上了加速器,从ChatGPT到DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一本新的AI芯片图书,以紧跟时代
    的头像 发表于 07-29 08:06 868次阅读
    【<b class='flag-5'>免费送</b><b class='flag-5'>书</b>】AI芯片,从过去走向未来:《AI芯片:前沿<b class='flag-5'>技术</b>与创新未来》

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    感谢电子发烧友提供学习Deepseek核心技术这本书的机会。 读完《Deepseek核心技术揭秘》,我深受触动,对人工智能领域有了全新的认识
    发表于 07-22 22:14

    【「DeepSeek 核心技术揭秘」阅读体验】--全书概览

    感谢平台提供的书籍,实物如下 这本书主讲从年前开始火热的DeepSeek 。书籍看起来轻薄,但言简意赅,通俗易懂,总览全局,比较精炼。 第一章 介绍DeepSeek的一系列技术突破与创新。 第二章
    发表于 07-21 00:04

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    一、模型架构 在阅读第三章关于 DeepSeek 的模型架构部分时,我仿佛打开了一扇通往人工智能核心构造的大门。从架构图中,能清晰看到 Transformer 块、前馈神经网络、注意力机制等模块
    发表于 07-20 15:07

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    前言 非常感谢发烧友论坛提供的《DeepSeek 核心技术揭秘》书籍试读活动!Deepseek-V3从去年年底出来之后,我就在密切关注着。今年春节前,
    发表于 07-17 11:59

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、腾讯AI,哪个能用、好用?没找到安装包,都是在线搜索?想要Windows版本和IOS版本或者安卓版本
    发表于 07-09 18:30

    【书籍评测活动NO.62】一本读懂 DeepSeek 全家桶核心技术DeepSeek 核心技术揭秘

    , incentivize.”也就是说,不要去“教”模型,而要“激励”它自主探索。 《DeepSeek核心技术揭秘》是剖析 DeepSeek 技术
    发表于 06-09 14:38

    比亚迪 · 超级e平台 · 技术方案的全面揭秘 | 第三曲: 30000转驱动电机 · 12项核心技术揭秘

    比亚迪 · 超级e平台 · 技术方案的全面揭秘 | 第三曲: 30000转驱动电机 · 12项核心技术揭秘
    的头像 发表于 06-08 07:20 1755次阅读
    比亚迪 · 超级e平台 · <b class='flag-5'>技术</b>方案的全面<b class='flag-5'>揭秘</b> | 第三曲: 30000转驱动电机 · 12项<b class='flag-5'>核心技术</b><b class='flag-5'>揭秘</b>

    【干货】开关电源相关设计资料46篇--3

    重磅消息,开关电源相关设计资料46篇免费送,需要可点击附件下载查看哦!
    发表于 03-07 16:22

    算力筑基!揭秘DeepSeek爆火的“心跳密码”——时钟同步

    当《哪吒2》登顶全球动画票房第一,DeepSeek也正在全球科技圈铸就新神话!作为国内时钟同步领域领衔者,赛思将以DeepSeek为例,从专业角度揭秘AI背后的“心跳密码”——时钟同步。
    的头像 发表于 03-03 13:59 845次阅读
    算力筑基!<b class='flag-5'>揭秘</b><b class='flag-5'>DeepSeek</b>爆火的“心跳密码”——时钟同步

    浅谈DeepSeek核心技术与应用场景

    DeepSeek的横空出圈,仿佛重现了两年前ChatGPT风靡全球的盛况。其开源策略和低成本的模式,正推动人工智能迎来一波新的发展浪潮。卓越模型能力的背后,DeepSeek技术上有哪些创新?它又将如何改变我们的生活和产业?
    的头像 发表于 02-18 09:08 3133次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和
    发表于 02-14 02:08

    深入探讨DeepSeek大模型的核心技术

    导读 本文深入探讨了DeepSeek大模型的核心技术,从公司背景、模型能力、训推成本到核心技术细节进行了全面分析。   一、关于DeepSeek公司及其大模型 1.1 公司概况
    的头像 发表于 02-10 10:49 3340次阅读
    深入探讨<b class='flag-5'>DeepSeek</b>大模型的<b class='flag-5'>核心技术</b>