0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

正面对决GPT-5和Germini-3,DeepSeek-V3.2震撼发布

章鹰观察 来源:电子发烧友原创 作者:章鹰 2025-12-02 14:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友网报道 文/章鹰)12月1日,中国 AI创新企业 DeepSeek 再度加速技术迭代,今日宣布推出 DeepSeek-V3.2 与 V3.2-Speciale 两款模型。公司在官网上指出,DeepSeek-V3.2达到了GPT-5的水平,DeepSeek-V3.2首次将“思考模式(thinking mode)”与工具使用深度整合,成为其下一代 AI 助理(AI agent)策略的核心布局。

DeepSeek V3.2带来的最大亮点,是Agent能力的升级。到底有哪些核心特性?

首先是架构创新,9月29日,DeepSeek V3.2实验版发布,引入了DSA稀疏注意力机制,经过2个月的持续优化,12月1日推出正式版。DSA稀疏注意力机制可以实现高效率与高性能的平衡:显著降低长文本处理的计算成本和延迟,使模型能更专注于深度推理。

DeepSeek 表示,V3.2 模型具备类人推理能力,并能自动调用搜索引擎、计算器与程序代码执行器等工具,上下文的窗口扩展到128K,可以理解更长的文档或者处理大型的数据分析。这是该公司首次让模型同时支持“思考”与“非思考”两种运行模式,并让推理链与工具使用无缝结合。官方技术报告指出,V3.2 在多项 reasoning 基准中,与 Kimi-k2-thinking 与 GPT-5 表现相当。

DeepSeek V3.2 模型略低于Gemini-3.0-Pro,相比Kimi-K2-Thinking, V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。

值得关注的是,在硬件架构和企业支持方面,DeepSeek V3.2 模型不仅对英伟达GPU做深度优化,让其支持FP8的混合精度计算,整体效率提升40%,同时他对华为昇腾、寒武纪等国产芯片进行适配,第一时间支持了华为昇腾,还完成了对VRLM框架的对接,并且和寒武纪同步发布了适配的源代码,确保在沐熙芯片上部署满血版的模型。AMD官方专门为DeepSeek V3.2 XP做了针对GPU的优化,全志科技在芯片和软件方面对DeepSeek进行了深度的协同。

另外,公司同步推出的 DeepSeek-V3.2-Speciale,其目标是将开源模型的推理能力推向极致,探索模型能力的边界。它主攻数学运算、长链推理与高难度计算任务,其在国际数学奥林匹亚(IMO)与国际信息奥林匹亚(IOI)等标准化测试上达到金牌水平,并在功能上对标 Google 最新的 Gemini-3 Pro。

经过测试显示,DeepSeek V3.2接近AI开源模型天花板级别,直接和顶级闭源AI大模型掰手腕。DeepSeek强调,在高度复杂任务上,Special模型大幅优于标准版本,但是消耗的Tokens也显著增多,成本更高,现在并没有开放给普通用户。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI大模型
    +关注

    关注

    0

    文章

    394

    浏览量

    942
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2799
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5震撼发布:AI领域的重大飞跃

    电子发烧友网报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,更以多维度性能
    的头像 发表于 08-09 07:44 9854次阅读
    <b class='flag-5'>GPT-5</b><b class='flag-5'>震撼</b><b class='flag-5'>发布</b>:AI领域的重大飞跃

    寒武纪成功适配DeepSeek-V3.2-Exp模型

    2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。
    的头像 发表于 10-11 17:14 1164次阅读
    寒武纪成功适配<b class='flag-5'>DeepSeek-V3.2</b>-Exp模型

    曙光AI超集群系统全面支持DeepSeek-V3.2-Exp

    9月29日,DeepSeek-V3.2-Exp正式发布并开源,引入创新的稀疏Attention架构。基于中国首个AI计算开放架构,芯片层、软件层、模型层实现“跨层协同”,使得曙光AI超集群系统完成对DeepSeek新版本的深度适
    的头像 发表于 09-30 16:18 1456次阅读

    AI Agent如何重构互联范式

    近日,在OpenAI发布GPT-5模型14天后,深度求索的新模型版本DeepSeek-V3.1正式发布
    的头像 发表于 08-28 09:58 700次阅读
    AI Agent如何重构互联范式

    OpenAI或在周五凌晨发布GPT-5 OpenAI以低价向美国政府提供ChatGPT

    外界一直在期待的OpenAI新一代大语言模型GPT-5或将发布。据外媒的报道,GPT-5很可能在周五凌晨发布。这是OpenAI在2023年的3
    的头像 发表于 08-07 14:13 8610次阅读

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    DeepSeek-V3中得到了优化升级。DeepSeek-V3发布几乎没有预热和炒作,仅凭借其出色的效果和超低的成本迅速走红。 紧接着,在2025年1月20日,DeepSeek正式
    发表于 07-17 11:59

    HarmonyOS NEXT开发实战:DevEco Studio中DeepSeek的使用

    /completions; 点击Body将model修改为deepseek-chat(对应DeepSeek-V3)或者deepseek-reasoner(对应DeepSeek-R1)
    发表于 03-07 14:56

    北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)

    应用》 ,就是来为没有专业的 AI 或 IT 技术背景的我们,解答 DeepSeek 是什么,有什么用的问题。 我们常听到的 GPT 一词,其实就是生成式预训练变换器(Generative
    发表于 02-27 17:57

    从性能到商业,Grok3GPT-4o、DeepSeek如何重塑AI版图?

    2025年2月,AI领域仿佛上演了一场激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型大放异彩的DeepSeek,三大巨头强势登
    的头像 发表于 02-19 18:14 1556次阅读
    从性能到商业,Grok<b class='flag-5'>3</b>、<b class='flag-5'>GPT</b>-4o、<b class='flag-5'>DeepSeek</b>如何重塑AI版图?

    了解DeepSeek-V3DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实质性
    发表于 02-14 02:08

    OpenAI即将发布GPT-4.5与GPT-5

    近日,OpenAI的首席执行官Sam Altman在社交平台上透露了公司即将推出的重大计划。据他透露,OpenAI计划在不久的将来连续发布两款重要的AI算法——GPT-4.5和GPT-5。 据悉
    的头像 发表于 02-13 13:43 1013次阅读

    OpenAI即将推出GPT-5模型

    先进技术,其中包括备受瞩目的o3工具。通过整合这些技术,GPT-5模型将实现更加强大的功能和性能。 值得一提的是,GPT-5模型将被广泛应用于OpenAI的聊天机器人ChatGPT以及API平台。这意味着用户将能够体验到更加智能
    的头像 发表于 02-13 11:21 912次阅读

    OpenAI CEO预告GPT-4.5及GPT-5未来规划

    全新的GPT-5模型。这一模型将整合包括o3在内的多项OpenAI先进技术,旨在为用户带来更加智能、高效的使用体验。值得注意的是,免费版的ChatGPT也将在标准智能设置下无限制地使用GPT-5进行对话,这无疑将进一步提升用户的
    的头像 发表于 02-13 10:02 737次阅读

    GPT-5研发进度滞后,成果与成本不匹配

    近日,OpenAI正在紧锣密鼓地研发的下一代大型语言模型GPT-5,其研发进度已落后于原计划。这一消息引起了业界的广泛关注。 报道指出,尽管OpenAI在GPT-5的研发上投入了大量的人力、物力
    的头像 发表于 12-23 14:16 796次阅读

    OpenAI GPT-5开发滞后:训练成本高昂

    近日,据最新消息,OpenAI在推进其备受期待的下一代旗舰模型GPT-5的开发进程上遇到了困难。由于计算成本高昂且高质量训练数据稀缺,GPT-5的开发已经落后于原定计划半年之久。 据悉,OpenAI
    的头像 发表于 12-23 11:04 1419次阅读