0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产AI新星DeepSeek崛起:日活超2000万,百万年薪抢人,或适配国产GPU

Felix分析 来源:电子发烧友 作者:吴子鹏 2025-02-06 09:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)在蛇年春节期间,国产AI大模型DeepSeek爆火,频繁登上国内外的热搜榜单,成为科技界最炙手可热的新星。根据第三方统计数据,DeepSeek应用上线仅仅20天,日活用户数量就突破了2000万大关,其日活增长速度已经超过了当初爆火的ChatGPT。


爆火之后,发布DeepSeek的幻方量化旗下AI公司杭州深度求索人工智能(AI)基础技术研究有限公司开始招兵买马,开放了多个岗位的招聘,并且给出了丰厚的薪资报酬。同时,有业内人士指出,DeepSeek或许会接入国产GPU,对国产GPU发展有着积极的带动作用。

DeepSeek现象级爆火后,公司和产业发展都将提速

今年1月20日,DeepSeek正式发布DeepSeek-R1,并同步开源模型权重。据介绍,DeepSeek-R1遵循MIT License,允许用户通过蒸馏技术借助R1训练其他模型。DeepSeek-R1上线API,对用户开放思维链输出,通过设置`model='deepseek-reasoner'`即可调用。

在性能方面,DeepSeek-R1比肩OpenAI的GPT-4。这款AI大模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1性能比肩OpenAI o1正式版。同时,由于这款模型采用的是开源策略,因此被认为具有更好的成长性。

目前DeepSeek-R1和更早之前发布的DeepSeek-V3得到了行业的广泛认可,包括京东云、百度云、华为云等云产品都已经接入DeepSeek大模型。以京东云来说,京东云已正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。华为云方面,2月1日,华为云宣布经过连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。同时,英伟达平台也已经宣布上线DeepSeek,英伟达网站显示,DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达面向开发者的网站上发布。根据介绍内容,英伟达认为,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。

多家分析机构认为,DeepSeek-R1和DeepSeek-V3模型的发布将加速AI应用落地。中信证券研报表示,DeepSeek火爆全球,对全球AI产业链带来强大借鉴意义,意味着AI大模型的应用将逐步走向普及,有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长;中航证券指出,DeepSeek在基础模型训练和推理模型训练方面均有创新,有效克服了推高模型成本的FP8训练精度不足、高质量数据匮乏等困难,极大降低了训练和推理成本;国泰君安认为,DeepSeek-R1的推出体现了开源范式下技术进步的速度,以及在AI训练、推理上成本大幅度压缩的可能,AI的广泛落地有望加速。

DeepSeek爆火之后,深度求索AI公司也进一步快速扩张。公开资料显示,DeepSeek员工数量大约为150人,属于规模较小的AI公司。作为对比,OpenAI目前约有1700名员工。为了扩张队伍,在招聘网站上,深度求索AI公司放出了一系列职位,涵盖客户端研发工程师深度学习研发工程师、全栈开发工程师、自然语言处理算法、深度学习研究员等不同工作内容。

薪酬方面,从正式员工岗位的招聘信息看,DeepSeek对员工薪酬采取“14薪”的模式。在Deepseek挂出的职位中,大部分岗位的起薪在2万元以上,不少年薪能够达到百万元级别。以深度学习研究员岗位为例,薪资水平为50—80k*14薪,工作地点为北京,招聘要求是在校或者应届的硕士生。这意味着,若按照最高月薪8万元计算,应届生入职DeepSeek,年薪就可达到112万元。除了正式员工,DeepSeek还招聘AGI大模型-数据百晓生实习生、深度学习-AGI实习生等实习岗位,实习工资为每天500元左右。

同时,DeepSeek爆火对美国AI产业造成了巨大的冲击。此前,DeepSeek的优异表现以及不及OpenAI近1/20的算力成本令英伟达股价曾一夜暴跌17%,市值蒸发近6000亿美元,这是美股单日最大跌幅。当天,DeepSeek给美国科技股带来了重创,除了英伟达外,博通、台积电、AMD和ASML等公司均出现了不同程度的下跌。

另外,DeepSeek的强大也引起了一些国家的担忧。比如,美国国会近日提出《2025年美国人工智能能力与中国脱钩法案》。法案主要内容包括:禁止美国人在中国境内推进人工智能能力,禁止下载或使用DeepSeek,否则将被定性为犯罪,最高可判处20年监禁。随后,意大利宣布,由于缺乏有关人工智能模型DeepSeek使用个人数据的信息,该机构已经下架了DeepSeek;法国隐私监管机构国家信息与自由委员会(CNIL)表示,该机构将对中国初创公司DeepSeek进行质询;澳大利亚称,DeepSeek对政府技术构成了“不可接受的风险”,立即实施禁令是为了“保护澳大利亚的国家安全和国家利益”。

DeepSeek有望接入国产GPU

笔者也在DeepSeek平台向这款大模型提问:DeepSeek为什么会爆火?

DeepSeek给出了6条总结,分别是:

·高性能与精准度:DeepSeek采用了先进的深度学习算法和大规模数据集进行训练,使其在多个应用场景中表现出色,如自然语言处理、图像识别等。其高精准度和快速响应能力赢得了用户的广泛认可。
·技术创新:DeepSeek在模型架构和训练方法上进行了多项创新,例如引入了更高效的神经网络结构和优化算法,这些技术突破显著提升了模型的性能和效率。
·强大的硬件支持:DeepSeek利用了NVIDIA的高性能GPU(如A100和H100),这些硬件提供了强大的计算能力,使得模型训练和推理过程更加高效,进一步提升了用户体验。
·广泛的应用场景:DeepSeek不仅在学术研究中表现出色,还在商业应用中展现了巨大的潜力。无论是智能客服、内容推荐,还是自动驾驶、医疗诊断,DeepSeek都能提供强有力的支持,满足了多样化的市场需求。
·开放与合作:DeepSeek团队积极与学术界和产业界合作,推动了技术的快速迭代和应用落地。同时,部分技术和工具的开放也吸引了大量开发者和研究者的参与,形成了良好的生态系统。
·市场推广与用户口碑:DeepSeek通过有效的市场推广策略和优质的用户体验,迅速积累了大量的用户和粉丝。用户的口碑传播进一步加速了其知名度的提升。

业内人士称,虽然DeepSeek曾一度重创英伟达股价,但是其也是基于英伟达的高性能计算芯片训练而来,英伟达芯片的领先性依然是毋庸置疑的。只不过,DeepSeek改变了传统AI大模型Scaling Law的逻辑,在训练过程中提升强化学习的权重,且更加注重推理。这一改变相较于此前的预训练权重高,可能会降低英伟达芯片的影响力,这也是美国科技产业恐慌的地方。

不过,无论如何,算力芯片依然是DeepSeek的基础,这一AI大模型并不是凭空出现的,只是改变了运用算力芯片的侧重点。有业内人士爆料称,在使用英伟达H800芯片训练DeepSeek时,没有采用CUDA代码,而是从CUDA生态的中间态表示入手,用PTX代码直接编写,而后转为目标GPU架构的机器码,这和传统英伟达CUDA生态的应用是有一定差异的。

此举引发了大量的猜测。其中一种猜测是,直接使用PTX代码编写就是为了绕开CUDA生态,为接入国产GPU做准备。在相关讨论中,也有研发人员表示,直接使用PTX代码编写对GPU有很强的针对性,H100上的代码一旦转移到H800或者A100上,效果可能就会打折扣,不过这一做法确实能够更好地发挥国产GPU的性能。PTX代码被称为GPU硬件的“母语”,并不是只针对英伟达GPU,这种做法确实容易引起联想。

目前,国产计算芯片可用于AI计算的产品有摩尔线程的MTT系列,燧原科技的云燧系列,寒武纪的思元系列,天数智芯的Big Island系列,以及华为的昇腾(Ascend)系列等,这些产品都有望在DeepSeek开启的AI大模型新纪元里广泛受益。

结语

DeepSeek的爆火是现象级的,颠覆了此前由OpenAI引领的预训练技术路线,提升了强化学习和推理的作用和权重,并在硬件的使用上独辟蹊径,将会引领全球AI产业发展的新潮流。DeepSeek的强大也展示了国内AI创新力量的强大,由于DeepSeek没有采用传统CUDA语言编程的做法,更是让人们对国产AI大模型产业的后续发展充满了无限想象。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DeepSeek
    +关注

    关注

    2

    文章

    837

    浏览量

    3392
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产来袭!2nm AI GPU

    的时间和成本内实现。   近日,据媒体报道,上海棣山科技有限公司(以下简称“棣山科技”)对外披露其2nm高端AI GPU芯片最新研发进展。据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。  
    的头像 发表于 04-15 07:02 7540次阅读

    DeepSeek V3.1发布!拥抱国产算力芯片

    电子发烧友网报道(文/李弯弯)2025年8月21DeepSeek正式官宣发布DeepSeek-V3.1大模型。新版本不仅在技术架构上实现重大升级,更通过参数精度优化与国产芯片深度
    的头像 发表于 08-23 07:55 1.7w次阅读
    <b class='flag-5'>DeepSeek</b> V3.1发布!拥抱<b class='flag-5'>国产</b>算力芯片

    端侧AI爆发!斯贝达全栈自研技术,助力国产AI算力崛起

    AI时代,算力已成为产业智能化的核心底座。国产算力凭借自主可控、场景适配与安全可靠的优势,在特种行业与垂直领域快速落地,正从技术支撑走向价值主导。在CITE2026展上,深圳市斯贝达电子产品经理段治
    的头像 发表于 04-14 16:51 4999次阅读

    聊一聊国产射频无源器件的崛起 —— 成都恒利泰十年深耕,适配多场景需求

    垄断。 很多同仁会担心,国产器件的性能比不上进口?其实这些年国产射频器件的技术已经日趋成熟,成都恒利泰的产品就是最好的证明。我们的产品体系十分完善,涵盖三大系列、2000多个活跃型号,精准覆盖各类射频
    发表于 04-11 15:27

    Neway微波国产化替代方案

    关键技术指标上已与进口产品持平,同时采购成本降低30%-45%。通过优化拓扑结构和散热设计,国产模块在高温老化测试中展现出更稳定的性能曲线,MTBF(平均无故障时间)突破10小时。电源模块优化降低成本
    发表于 01-30 08:45

    又一国产GPU企业上市

    电子发烧友网报道 1月8,上海天数智芯半导体股份有限公司(以下简称“天数智芯”)正式在香港联合交易所主板挂牌上市,开盘价达190.2港元/股,高开31.54%,市值400亿港元。作为中国首家通用
    的头像 发表于 01-08 18:09 7036次阅读

    国产崛起合粤固态电容,打破系垄断新格局

    在电子元器件领域,系品牌曾长期占据固态电容市场的主导地位,凭借技术积累形成垄断壁垒,导致国内企业面临 “高价采购、供货受限、技术卡脖子” 的困境。如今,随着国产制造的强势崛起,合粤以自主研发实力
    的头像 发表于 12-13 10:58 540次阅读

    中科曙光AI集群系统和scaleX640节点等产品全面适配DeepSeek V3.2

    层实现“跨层协同”,曙光AI集群系统、scaleX640节点等产品0day完成对DeepSeek新版本的深度适配与调优,支持各行各业客户
    的头像 发表于 12-05 14:32 914次阅读

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么
    的头像 发表于 11-28 09:39 6930次阅读
    NVIDIA RTX PRO <b class='flag-5'>2000</b> Blackwell <b class='flag-5'>GPU</b>性能测试

    成都汇阳投资关于国产开源模型持续突破,国产AI 竞争力增强

           国产开源模型领跑 ,AI 生态有望加速繁荣 根据独立 AI 基准测试与分析平台 Artificial Analysis 最新榜单 , 国产模型 KimiK2Thinkin
    的头像 发表于 11-24 14:01 704次阅读

    曙光AI集群系统全面支持DeepSeek-V3.2-Exp

    9月29DeepSeek-V3.2-Exp正式发布并开源,引入创新的稀疏Attention架构。基于中国首个AI计算开放架构,芯片层、软件层、模型层实现“跨层协同”,使得曙光AI
    的头像 发表于 09-30 16:18 1853次阅读

    AI驱动连接器赛道,材料界“DeepSeek”加速国产

    的材料,则是构建强大连接系统的基石。 如今,材料界的“DeepSeek”们正加速推动高速连接器材料的国产化进程,打破国外垄断,为AI产业的自主可控注入强劲动力。 百亿高速连接器市场 材料革命重塑
    的头像 发表于 07-07 14:04 905次阅读

    清微智能官宣:国产可重构芯片全球出货量突破2000

    芯片累计出货量已突破2000颗,成为全球销量领先的可重构芯片厂商。 2000颗出货量 坚持高阶国产替代,从清华实验室到
    的头像 发表于 06-12 17:15 1968次阅读
    清微智能官宣:<b class='flag-5'>国产</b>可重构芯片全球出货量突破<b class='flag-5'>2000</b><b class='flag-5'>万</b>颗

    国产封装测试技术崛起,江西万年芯构建实力护城河

    的需求呈现爆发式增长。国内封装测试行业迎来黄金发展期,而江西万年芯微电子凭借其技术创新实力,正成为国内封测产业的重要推动者。重塑封装产业格局,国产力量加速崛起随着半导
    的头像 发表于 05-21 16:47 1804次阅读
    <b class='flag-5'>国产</b>封装测试技术<b class='flag-5'>崛起</b>,江西<b class='flag-5'>万年</b>芯构建实力护城河

    国产升压芯片如何单节锂电3.7V升压24V4.2V升压24V

    芯片的崛起 在便携式设备、智能硬件、工业控制等领域,如何将单节锂电池的‌3.7V/4.2V低压‌高效稳定地升压至‌24V更高电压‌,一直是工程师面临的痛点。传统进口芯片成本高、供货周期长,而国产
    发表于 04-23 11:11