0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek开源新版R1 媲美OpenAI o3

A面面观 2025-05-29 11:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

DeepSeek“悄悄”地又放了一个大招,DeepSeek开源了R1最新0528版本。尽管DeepSeek目前还没有对该版本进行任何说明,但是根据著名代码测试平台Live CodeBench数据;还有一些网友的实测评价都显示,DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性价比的平替。

此外,关于DeepSeek的R2大模型的传闻也很多,比如“参数规模被曝达到惊人的1.2万亿,相比前代R1的6710亿参数几乎翻倍等”。业界还在期待DeepSeek推出更牛的R2模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OpenAI
    +关注

    关注

    9

    文章

    1248

    浏览量

    10263
  • DeepSeek
    +关注

    关注

    2

    文章

    837

    浏览量

    3392
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度腾讯抢滩布局!DeepSeek-R1升级和开源背后,国产AI的逆袭之路

    Hugging Face平台开源。用户可通过官方网页、App、小程序进入对话界面后,开启“深度思考”功能体验最新版本。API也已同步更新,调用方式不变。   DeepSeek-R1-0528编程能力提升
    的头像 发表于 06-03 06:34 6351次阅读

    DeepSeek爆火一周年的寂静

    ,争先恐后地展示技术进步。而另一边,则是DeepSeek新模型缺席春节假期,与一年前R1横空出世、引爆全球关注的高光姿态,形成了鲜明对比。   恰逢R1爆火一周年的时刻,我们回溯了过去一年De
    的头像 发表于 02-26 14:15 1.1w次阅读
    <b class='flag-5'>DeepSeek</b>爆火一周年的寂静

    黄仁勋新年第一场演讲提了DeepSeek 黄仁勋:机器人领域迎来ChatGPT时刻

    DeepSeek:黄仁勋称开源模型成创新催化剂,Deepseek R1模型推动行业变革,Deepseek
    的头像 发表于 01-06 11:23 5911次阅读

    本地部署openWebUI + ollama+DeepSeek 打造智能知识库并实现远程访问

    DeepSeek是一款由国内人工智能公司研发的大型语言模型,实现了媲美OpenAI-o1模型的效果,拥有强大的自然语言处理能力,还大幅降低了推理模型的成本,受到海内外用户的广泛吹捧
    的头像 发表于 09-10 16:41 5507次阅读
    本地部署openWebUI + ollama+<b class='flag-5'>DeepSeek</b> 打造智能知识库并实现远程访问

    DeepSeek R1 MTP在TensorRT-LLM中的实现与优化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,Multi-Token Prediction (MTP) 实现了大幅提速
    的头像 发表于 08-30 15:47 4652次阅读
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的实现与优化

    如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量

    开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言模型 (LLM) 的推理效率。
    的头像 发表于 08-12 15:19 4473次阅读
    如何在NVIDIA Blackwell GPU上优化<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>吞吐量

    速看!EASY-EAI教你离线部署Deepseek R1大模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型。DeepSeek-R1采用强化学习进行后训练,旨在提升推理能力,尤其擅
    的头像 发表于 07-25 15:22 1560次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型

    【「DeepSeek 核心技术揭秘」阅读体验】--全书概览

    讲解Deepseek的使用方法 第三章 深入剖析Deepseek-V3的模型架构、训练框架、推理阶段优化、后训练优化等关键技术 第四章关于DeepSeek-R1的技术剖析 第五章 从宏观角度分析
    发表于 07-21 00:04

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    可能大家耳熟能详的是DeepSeek-R1,这是在网页端开启了“深度思考”模式后调用的模型,如果不开,则是用的V3模型。但是,DeepSeek模型家族不止有V3
    发表于 07-17 11:59

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 1410次阅读
    Arm Neoverse N2平台实现<b class='flag-5'>DeepSeek-R1</b>满血版部署

    “天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型

    电子发烧友网报道(文 / 吴子鹏)根据门萨智商(IQ)测试中的表现,OpenAI o3 在全球 “智商最高” 的人工智能模型 TOP 24 中位居榜首,在门萨测试中获得了 135 的高分,跻身
    的头像 发表于 06-15 01:56 6230次阅读
    “天才”!<b class='flag-5'>OpenAI</b> <b class='flag-5'>o3</b> 成全球 IQ 最高的 AI 大模型

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    ,仅凭极少标注数据便大幅提升了模型的推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1 的效果已可比肩 OpenAI-o1 正式版。 DeepSeek-R1 在基准测试中的表现
    发表于 06-09 14:38

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 1845次阅读
    瑞萨RZ/V2H平台支持部署离线版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大语言模型

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    开源新一代通义千问模型Qwen3。据悉,Qwen3模型参数量仅为DeepSeek - R11/
    的头像 发表于 04-30 16:08 1474次阅读

    全新讯飞星火X1还有哪些升级

    本次升级,首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式。同时在通用任务效果,星火X1实现显著提升,整体效果对标OpenAI o1DeepSeek
    的头像 发表于 04-22 16:24 1054次阅读