0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超过150万个大模型,DeepSeek全球最受欢迎

Felix分析 来源:电子发烧友 作者:吴子鹏 2025-02-25 00:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文 / 吴子鹏)北京时间 2 月 24 日凌晨 3 点,全球最大开源平台之一 huggingface 联合创始人兼首席执行官 Clement Delangue 发布的最新数据显示,中国开源大模型 DeepSeek-R1 在 huggingface 平台上超过 150 万个模型中脱颖而出,成为该平台最受欢迎的开源大模型,点赞数突破 1 万。


目前,DeepSeek 已在全球范围内成为爆火的 AI 大模型。1 月 26 日,DeepSeek 首次登上苹果 App Store 全球榜首并持续领先。上线 18 天,其下载量达到 1600 万次,几乎是同期 ChatGPT 下载量的两倍,其中印度是新用户增长的最大来源地。据统计,DeepSeek 目前在全球 140 多个国家的 App 榜单中位居第一。

在流量方面,2025 年 1 月,DeepSeek 网站的桌面和移动访问量飙升至 2.78 亿次,而2024年12月仅为 1200 万次。中国贡献了近四分之一的桌面流量,美国、巴西、印度、德国等国家也占据一定比例。

此前,Clement 特意发文祝贺 DeepSeek-R1 下载量突破 1000 万次,这一成绩也创造了 huggingface 平台有史以来最受欢迎模型的记录。

那么,DeepSeek 究竟给开源大模型的发展带来了什么,使其如此火爆?

DeepSeek 给开源大模型发展带来的影响

DeepSeek 通过技术创新和商业策略的突破,重塑了开源大模型行业的竞争格局,为开源 AI 大模型的发展带来了积极影响。

带动技术创新
DeepSeek 在模型训练中采用强化学习和模型蒸馏技术,在减少模型参数规模的同时提升性能。例如,R1 模型在数学推理任务中的准确率高达 97.3%。在架构设计方面,以 DeepSeek-V3 为例,其首创多头潜注意力机制,有效解决了长文本推理时的显存效率瓶颈问题,还革新了动态路由算法,提高了专家利用率。

降低成本
DeepSeek 降低了开源大模型的训练成本、推理成本和模型使用成本。其采用的混合专家模型(MoE)架构利用动态冗余策略,将计算成本降低至传统模型的 1/10。结合自研的稀疏结构(MLA 架构),提升了推理效率,实现了性能与成本的平衡。通过纯深度学习方法,DeepSeek 使 AI 涌现出自发推理能力,在数学、代码、自然语言推理等任务上达到国际顶尖水平(如比肩 GPT-4/o1)。借助这些创新,DeepSeek 将大模型训练成本压缩至 560 万美元量级,仅为美国同类模型的 1/100,打破了动辄数亿美元投入的行业惯例。同时,DeepSeek 通过开源以及提供低成本的 API开发者可以自由定制和二次开发。其 API 定价亲民,仅为 OpenAI 同类产品的 1/10,让中小企业能够以较低成本进入 AI 领域,推动了大模型在更多领域的应用和创新。

拓展应用边界
DeepSeek 拓展了开源大模型新的应用边界,使 AI 大模型得以广泛落地。DeepSeek 采用免费商用开源策略,完全开放模型源码并支持衍生开发,推动开发者生态快速扩张。这种 “零门槛 + 零成本” 模式直接导致行业价格体系崩塌,API 使用成本降至 OpenAI 的 5%,最终引领市场进入 “按厘计价” 甚至零成本时代。这一举措激发了全球开发者的热情,推动了技术共享与社区协作。众多开发者基于 DeepSeek 的模型进行创新,加速了垂直领域小模型的发展。同时,DeepSeek 凭借模型压缩等技术,成功适配智能眼镜、工业终端等边缘设备。在金融交易、工业质检、医疗影像分析等众多垂直领域展现出独特的应用优势,为各行业的数字化转型提供了强大动力,极大地拓展了开源大模型的应用场景。

推动模型融合
DeepSeek 推动了开源大模型和闭源大模型的融合。其开源模型 R1 发布后,迫使阿里、腾讯等巨头跟进降价,同时刺激全球开发者社区加速创新。在这个过程中,相当一部分闭源大模型选择与 DeepSeek 进行融合。例如,2025 年 2 月,文心一言(现更名为 “文小言”)App 的 4.9.0 版本更新,接入了 DeepSeek-R1 开源大模型,借助该模型优化了拍照解题功能,通过 “思维链” 技术将解题过程可视化;2 月 6 日,吉利汽车宣布将自研的星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等与 DeepSeek R1 大模型深度融合,以重新定义智能汽车的人机交互及智能驾驶;医渡科技的 “AI 医疗大脑” YiduCore、智云健康的 “智云大脑” 等医疗领域的闭源模型也接入了 DeepSeek-R1 模型,用于升级智能预问诊、病历生成与质控等核心医疗 AI 应用。DeepSeek 的成功促使其他大模型开发者如 OpenAI、百度等开始重新审视开源策略,对整个行业的发展起到了积极的推动作用。

毫无疑问,DeepSeek 改变了 AI 大模型的市场格局。凭借低成本、高性能、全国产的特点,引发人工智能产业生态巨变,在一定程度上冲击了 OpenAI 等巨头主导的市场格局,加快形成大模型市场的新增长极,推动了整个行业的创新发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DeepSeek
    +关注

    关注

    2

    文章

    837

    浏览量

    3396
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025年北汇信息在电子发烧友的十大最受欢迎文章

    的广泛关注,故整理了最受欢迎的十大文章,看看大家最关心的是哪些内容。 2026年,欢迎大家多多交流和反馈,有什么感兴趣的的汽车电子测试相关的内容,我们会努力原创,更多
    的头像 发表于 12-29 14:39 478次阅读
    2025年北汇信息在电子发烧友的十大<b class='flag-5'>最受欢迎</b>文章

    如何在ZYNQ本地部署DeepSeek模型

    将最小号 DeepSeek 模型部署到 AMD Zynq UltraScale+ MPSoC 处理系统的项目。
    的头像 发表于 12-19 15:43 7808次阅读
    如何在ZYNQ本地部署<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b>

    【获奖名单】2025开发板评测大赛优秀开发者、最受欢迎开发板公布

    试用测评后通过问卷调查投票,选出了各自心目中最受欢迎的开发板。现将名单一同予以公示。 大赛作品详情:【作品精选】2025电子发烧友开发板测评大赛作品合集! 优秀作品开发者: 专题厂商试用板子用户
    发表于 11-21 09:31

    看点:OpenAI全球企业客户数量超过100 ASML:半导体产业开放合作是主流

    ,以及通过开发者平台直接消费模型的企业。这意味着OpenAI全球企业客户数量超过100。 此外,OpenAI还透露,ChatGPT每周活跃用户超过
    的头像 发表于 11-06 16:17 855次阅读

    DeepSeek模型如何在云服务器上部署?

    随着大型语言模型(LLM)的应用日益普及,许多开发者和企业希望将像DeepSeek这样的优秀模型部署到自己的云服务器上,以实现私有化、定制化服务并保障数据安全。本文将详细阐述部署DeepSee
    的头像 发表于 10-13 16:52 1132次阅读

    [投票评选]2025电子发烧友开发板测评大赛--最受欢迎开发板

    2025电子发烧友开发板测评大赛--最受欢迎开发板 大赛详情: 电子发烧友携手 16 家生态厂商发起开发板测评大赛,设 OpenHarmony、RISC - V、Rockchip 三大赛道,共计
    发表于 10-13 16:25

    NVIDIA从云到边缘加速OpenAI gpt-oss模型部署,实现150TPS推理

    的发布持续深化了双方的 AI 创新合作。NVIDIA 在 NVIDIA Blackwell 架构上优化了这两款全新的开放权重模型并实现了推理性能加速,在 NVIDIA 系统上至高达到每秒 150
    的头像 发表于 08-15 20:34 2486次阅读
    NVIDIA从云到边缘加速OpenAI gpt-oss<b class='flag-5'>模型</b>部署,实现<b class='flag-5'>150</b><b class='flag-5'>万</b>TPS推理

    速看!EASY-EAI教你离线部署Deepseek R1大模型

    和自然语言推理等复杂任务。作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。本文主要说明DeepSeek-R1
    的头像 发表于 07-25 15:22 1572次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> R1大<b class='flag-5'>模型</b>

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    -V3的版本区别, 深入了解Deepseek的技术细节,快速掌握大模型领域的前沿知识,洞察对行业应用的影响,提升自身在该领域的专业水平和竞争力。 本书流程非常清晰,先认识Deepseek性能,然后讲解原理,底层
    发表于 07-22 22:14

    【「DeepSeek 核心技术揭秘」阅读体验】--全书概览

    DeepSeek对人工智能技术格局的一影响 第六章 DeepSeek开源技术剖析 第七章 大模型发展未来展望 全书图文并茂,对专业技术属于进行了讲解,也有对流程、框架、参数的展示,结
    发表于 07-21 00:04

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    模型圈子,其多项性能超过了当时处于领先地位的ChatGPT 4,也证明了不需要高昂的费用也能训练出优质大模型。这激起了我的好奇心,借着这次机会好好阅读一下DeepSeek的核心技术。
    发表于 07-17 11:59

    最受欢迎的单板计算机 x 最流行的移动操作系统

    在本文中,我们将揭秘:应在树莓派上使用Android的4理由从哪里获取树莓派的Android系统?该选择哪一?未来展望。在树莓派上使用Android的4理由树莓派无疑是世界上最受欢迎
    的头像 发表于 06-18 17:20 920次阅读
    <b class='flag-5'>最受欢迎</b>的单板计算机 x 最流行的移动操作系统

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    2025年年初,DeepSeek 成为全球人工智能(AI)领域的焦点,其DeepSeek-V3 和DeepSeek-R1 版本在行业内引发了结构性震动。
    发表于 06-09 14:38

    DeepSeek开源新版R1 媲美OpenAI o3

    DeepSeek“悄悄”地又放了一个大招,DeepSeek开源了R1最新0528版本。尽管DeepSeek目前还没有对该版本进行任何说明,但是根据著名代码测试平台Live CodeBe
    的头像 发表于 05-29 11:23 1480次阅读

    DeepSeek 引领边缘 AI 芯片向更高性能、更低功耗、更强泛化能力的方向演进

    量从十亿量级到数百亿甚至千亿级不等。例如,DeepSeek LLM 67B 在多项评测中已超过同级别开源模型。这些模型通常采用 Transformer 架构及如多头潜在注意力(MLA)
    的头像 发表于 05-09 10:27 2413次阅读