0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度腾讯抢滩布局!DeepSeek-R1升级和开源背后,国产AI的逆袭之路

Carol Li 来源:电子发烧友网 作者:李弯弯 2025-06-03 06:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,当前版本为DeepSeek-R1-0528。次日,DeepSeek-R1-0528正式在Hugging Face平台开源。用户可通过官方网页、App、小程序进入对话界面后,开启“深度思考”功能体验最新版本。API也已同步更新,调用方式不变。

DeepSeek-R1-0528编程能力提升最为显著

DeepSeek-R1-0528仍然以2024年12月发布的DeepSeek V3 Base模型为基座,通过在后训练过程中投入更多算力,显著提升了模型的思维深度与推理能力。

官方称,在数学、编程与通用逻辑等多个基准测评中,DeepSeek-R1-0528取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上接近其他国际顶尖模型,如OpenAI的o3 高版本与o4 mini模型、Google的Gemini-2.5-Pro等。

在编程能力方面,DeepSeek-R1-0528能力的提升最为显著。知名代码测试平台Live CodeBench显示,新版本性能可以媲美OpenAIo3模型的高版本。据测试者反馈,DeepSeek-R1-0528能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现(如天气卡片动画、数据可视化)中更加精准。另外,在模拟物理碰撞的编程任务中,其表现优于一些其他模型。它还能用Python 编写将Word文档中的图片提取到固定路径的小程序,在短时间内完成任务。

在复杂推理任务中,DeepSeek-R1-0528的表现也有显著提升。在AIME 2025测试中,新版模型的准确率从旧版的70%提升至87.5%。这一提升得益于模型在解题过程中进行了更为详尽和深入的思考,旧版模型平均每题使用12K tokens,而新版模型平均每题使用 23K tokens。此外,它还能正确回答“9.9 - 9.11 = ?”这类难倒其他顶流大模型的数字新难题。

创意写作能力上,DeepSeek-R1-0528 输出的文本更加自然,结构更有层次感,展现出了独特的推理风格,不仅速度很快,而且进行了充分的思考。在旧版R1的基础上,DeepSeek-R1-0528 针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

在其他能力方面,如幻觉改善,DeepSeek-R1-0528针对幻觉问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更为准确、可靠的结果。

此外,DeepSeek-R1-0528 还支持工具调用功能,尽管不支持在 thinking 中进行工具调用,但在Tau-Bench测评中表现良好,与OpenAI o1-high相当。API方面,DeepSeek-R1-0528已同步更新,接口与调用方式保持不变,但增加了Function Calling 和JsonOutput的支持。

目前,百度智能云千帆大模型平台正式上架了DeepSeek最新的R1-0528大模型。千帆模型开发平台同步支持DeepSeek-R1最新版的批量推理、模型评估、推理日志挖掘分析以及模型蒸馏功能,全流程工具链支持企业构建自己的专属大模型;千帆应用开发平台上的企业级RAG、Agent、工作流、百度AI搜索组件等功能也完成对DeepSeek新模型全链路接入,支持企业基于DeepSeek-R1-0528定制专属应用。文小言App也全面接入了DeepSeek最新模型。

腾讯旗下元宝、ima、搜狗输入法、QQ浏览器等多款产品也已接入了 DeepSeek R1-0528版本。用户打开元宝(电脑版、网页版可抢先体验)、ima、搜狗输入法(Windows版侧边栏)、QQ浏览器,选择DeepSeek模型R1深度思考,即可免费不限量使用。

全球AI大模型技术能力持续突破

近些年,全球大模型技术能力持续突破,原生多模态大模型成为技术演进的重要方向,通过打通视觉、音频、3D等模态数据,实现端到端输入输出。例如,百度文心大模型4.5系列实现了文本、图像和视频的混合训练,显著提升了多模态理解能力。

基于长思维链的“慢思考”技术成为提升模型逻辑推理能力的关键。例如,OpenAI的o1模型通过强化学习和思维链技术,在STEM领域的推理能力显著增强,并具备自我反思与错误修正能力。

模型参数量呈指数级增长,例如从GPT-2的15亿参数跃升到GPT-4的数千亿参数。同时,训练数据集规模每八个月翻一番,推动了模型性能的持续提升。

目前全球各大模型呈现多元化竞争态势,国内外模型在不同唯独展开激烈竞争。从技术能力上来看,在国外,OpenAI的GPT系列(如GPT - 4)通过大规模训练和计算资源,在生成文本和理解语言方面表现出色,具备强大的语言理解和生成能力,在复杂的文本生成和学术研究领域占据优势。Google的Gemini系列结合了Google Brain和DeepMind技术,追求极致的多模态和推理性能,在多模态支持方面具备最全面的能力,如原生支持文本、图像、音频、视频和代码等多种模态输入输出。

在国内,DeepSeek通过创新的算法优化和高效的资源利用,提供了具备竞争力的选择。其DeepSeek - R1模型在推理速度和计算资源消耗方面具有显著优势,在推理能力、编程表现及交互体验方面实现显著突破,在数学、编程与通用逻辑等多个基准测评中取得了国内领先的成绩。百度的文心大模型在自然语言处理、知识图谱构建等方面技术成熟,广泛应用于智能搜索、智能写作、智能客服等领域。商汤科技专注于计算机视觉深度学习技术,在图像识别、视频分析等方面的技术实力强劲,其大模型在智能安防、智慧城市等领域有广泛应用。

从应用场景上来看,国外GPT - 4适用于跨国智库咨询、新药研发分子关系推理等场景。摩根士丹利使用GPT - 4.5生成投行报告,分析师效率提升70%。Gemini系列适用于跨境电商客服、全球舆情监控等场景,沃尔玛定制Gemini客服系统,支持50种语言实时翻译。

国内DeepSeek在智能客服、医疗健康等领域具有强大潜力。文心一言深度绑定政企市场,覆盖98%部委合规标准,在国企流程自动化、医疗病历结构化分析等场景有应用,如国家卫健委疫情政策解读报告生成。通义千问在电商场景表现突出,是电商场景霸主,在直播脚本生成、竞品舆情分析准确率超90%,如天猫双11自动生成百万级个性化商品描述。

从生态方面来看,国外OpenAI凭借其强大的语言理解和生成能力,吸引了全球的开发者和企业。Google依托谷歌TPU算力垄断和搜索数据优势,推动Gemini系列的发展。

国内百度汇聚了大量高端人才,平台技术发展全面且快速,文心大模型在内部和外部应用方面双向发力,积累了较多行业应用案例。阿里电商生态加持通义千问,使其与阿里云无缝集成,可一键调用云计算、支付、物流接口。腾讯整合微信、游戏生态,调用微信社交语料,生成“网感”最强内容,在游戏NPC交互方面,实时生成剧情对话,玩家留存率提升25%。

写在最后

可以预见,随着产业链技术的不断成熟,大模型将在更多行业得到广泛应用,推动各行业的智能化发展。随着生成式模型在图像、视频侧的处理能力提升,叠加推理优化带来的降本,AI超级应用有望出现,改变人机交互方式。从市场趋势来看,全球大模型行业市场规模将持续扩大,头部企业将巩固地位,新兴企业将寻求突破。开源社区、合作伙伴和应用开发者将成为生态竞争的关键。完善的生态系统将增强用户粘性,促进技术创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296319
  • 百度
    +关注

    关注

    9

    文章

    2368

    浏览量

    94221
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2799
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度搜索接入DeepSeek,业内人士开始担心

    开启灰度测试接入 DeepSeek。被灰度到的用户,可在对话框顶部搜索入口看到 “AI 搜索” 字样,点击进入后,便能免费使用 DeepSeek-R1 满血版模型。   目前,各领域头部企业基本都已宣布接入
    的头像 发表于 02-18 00:59 4197次阅读
    <b class='flag-5'>百度</b>搜索接入<b class='flag-5'>DeepSeek</b>,业内人士开始担心

    如何使用OpenVINO运行DeepSeek-R1蒸馏模型

    DeepSeek-R1在春节期间引发了全球科技界的热度,DeepSeek-R1 是由 DeepSeek 开发的开源推理模型,用于解决需要逻辑推理、数学问题解决和实时决策的任务。
    的头像 发表于 03-12 13:45 2019次阅读
    如何使用OpenVINO运行<b class='flag-5'>DeepSeek-R1</b>蒸馏模型

    实战案例 | 299元国产工业AI核心板部署DeepSeek-R1

    前言:在AIoT领域,搭载Ubuntu系统的眺望T527开发板,仅凭2GB内存便成功运行15亿参数的DeepSeek-R1轻量级大模型!在边缘端上演一场算力革命,这一突破性进展不仅刷新了边缘AI设备
    的头像 发表于 03-06 08:30 1194次阅读
    实战案例 | 299元<b class='flag-5'>国产</b>工业<b class='flag-5'>级</b><b class='flag-5'>AI</b>核心板部署<b class='flag-5'>DeepSeek-R1</b>

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效
    发表于 02-27 16:45

    百度搜索全量接入DeepSeek-R1满血版

    就在今天,百度APP全量上线「AI搜索」入口,打开百度APP→点击首页底部AI入口,即可进入搜索页面,体验不同的模型解决复杂问题。
    的头像 发表于 02-25 10:24 1263次阅读

    Infinix AI接入DeepSeek-R1满血版

    传音控股旗下Infinix品牌正式宣布接入DeepSeek-R1满血版,2月26日起支持XOS 14.5及以上版本的Infinix机型可通过升级使用,3月份将发布的全新NOTE系列也将接入DeepSeek-R1,开启“Infin
    的头像 发表于 02-21 16:08 1182次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实质性
    发表于 02-14 02:08

    百度智能云发布昆仑芯三代万卡集群及DeepSeek-R1/V3上线

    支持,同时有效提升了百度和客户的资源整体利用率,降低大模型训练成本,推动了模型降本的趋势,为整个行业提供了新的思路和方向。 02百度智能云宣布上线DeepSeek-R1/V3 2月3日,百度
    的头像 发表于 02-11 10:58 958次阅读

    AIBOX 全系产品已适配 DeepSeek-R1

    国产AI大模型DeepSeek以出色的性价比和高效的模型技术,迅速成为全球AI关注的焦点。Firefly开源团队率先实现AIBOX系列产品对
    的头像 发表于 02-08 17:30 938次阅读
    AIBOX 全系产品已适配 <b class='flag-5'>DeepSeek-R1</b>

    软通动力天璇MaaS融合DeepSeek-R1,引领企业智能化转型

    近期,国产高性能AI推理模型DeepSeek-R1AI领域引发了广泛关注。凭借其强化学习驱动的推理能力、高性能低成本的优势以及开源策略,
    的头像 发表于 02-08 09:57 899次阅读

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自发布以来吸引了众多用户关注,为了让 deepin 用户更好地体验这一前沿技术,UOS AI 现已适配接入 DeepSeek-R1 端侧模型!无需忍受服务器崩溃,两步即可在本地独享
    的头像 发表于 02-08 09:52 2209次阅读

    芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!

    近期,国产大模型 DeepSeek-R1横空出世,迅速成为AI领域的焦点。 芯动力在24小时内完成了与DeepSeek-R1大模型的适配。 Deep
    的头像 发表于 02-07 16:55 894次阅读
    芯动力神速适配<b class='flag-5'>DeepSeek-R1</b>大模型,<b class='flag-5'>AI</b>芯片设计迈入“快车道”!

    DeepSeek-R1全尺寸版本上线Gitee AI

    DeepSeek 全套蒸馏模型以及 V3 版本上线后,经过 Gitee AI 和沐曦团队两天紧锣密鼓的适配和机器筹备,DeepSeek-R1全尺寸版本现在已上线 Gitee AI
    的头像 发表于 02-07 15:25 1804次阅读

    原生鸿蒙版小艺App上架DeepSeek-R1AI智慧体验更丰富

    升级至11.2.10.310版本及以上,打开小艺App,点击“发现”-“智能体”-“DeepSeek-R1”,即可体验DeepSeek。或者也可以唤醒
    的头像 发表于 02-07 13:24 1959次阅读

    百度云与阿里云上线DeepSeek模型部署服务

    近日,百度智能云和阿里云相继宣布上线DeepSeek-R1DeepSeek-V3模型的部署服务,为开发者和企业用户提供了更加高效便捷的AI服务体验。
    的头像 发表于 02-05 15:40 1165次阅读