0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

章鹰观察 来源:厂商供稿 作者:英特尔 2025-08-26 19:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔Gaudi 2E以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的加速落地提供新选择。

英特尔Gaudi 2E配备96 GB大容量内存,搭载先进的HBM控制器,针对随机访问、线性访问场景进行深度优化,有效避免了AI训练或推理任务的延迟,从而保障了计算流程的流畅性。英特尔Gaudi 2E拥有卓越的可扩展能力,支持多卡互联,为用户提供了灵活的、可定制化的解决方案,满足其不断变化的AI需求。

英特尔Gaudi 2E以出色的适配性和易用性,为诸多大模型应用提供支持。实测数据显示,在英特尔Gaudi 2E的支持下,DeepSeek-V3.1无论是在问答还是编码上,能力都有着显著提升:在部署了8张英特尔Gaudi 2E的一体机服务器上运行DeepSeek-V3.1模型,在输入/输出token长度均为1k、多用户并发数为30的条件下,每个并发token生成速率达到每秒10 token;在输入/输出token长度均为2k、多用户并发数为28的条件下,每个并发token生成速率达到每秒10 token。

无论是要求逻辑严密的数学计算还是考验分析能力的知识理解,基于英特尔Gaudi 2E的DeepSeek-V3.1均能迅速响应,高效完成解析。这种强大的组合,不仅大幅提升了问题解决的效率,更助力用户在多维度、高难度的推理场景中轻松跨越障碍。

通过开放的架构、强大的技术支持和紧密的生态合作,英特尔将持续赋能AI产业的创新与发展,加速AI大模型技术的普惠落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI加速器
    +关注

    关注

    1

    文章

    73

    浏览量

    9429
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek V3.1发布!拥抱国产算力芯片

    电子发烧友网报道(文/李弯弯)2025年8月21日,DeepSeek正式官宣发布DeepSeek-V3.1大模型。新版本不仅在技术架构上实现重大升级,更通过参数精度优化与国产芯片深度适配。从混合推理
    的头像 发表于 08-23 07:55 1.6w次阅读
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>V3.1</b>发布!拥抱国产算力芯片

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 414次阅读
    边缘计算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>类型与应用

    亚马逊云科技宣布推出Qwen3与DeepSeek-V3.1模型的完全托管服务

    的多种模型选项。DeepSeek-V3.1在数学、编程和Agentic任务方面展现出卓越性能。 · 与专有模型不同,开放权重模型让开发者能够深入了解模型权重,从而可以根据用户需求进行定制化。 · 此次发布 的模型与来自 Meta、Mistral AI以及最近加入的Open
    的头像 发表于 09-19 10:11 534次阅读

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理,其中一款677
    的头像 发表于 06-27 11:44 596次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3 AI
    的头像 发表于 05-21 00:57 6947次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系
    的头像 发表于 05-20 12:27 5136次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    Pro B50 GPU,搭载了AI推理和专业工作站量身定制的配置,扩展了英特尔锐炫Pro产品系列。 英特尔 ® Gaudi 3
    发表于 05-20 11:03 1664次阅读

    英特尔借助开放生态系统,加速边缘AI创新

    的集成,这些解决方案精简并加速AI在边缘的应用,包括在零售、制造、智慧城市、媒体和娱乐等行业的部署。 英特尔公司副总裁兼边缘计算事业部总经理Dan Rodriguez表示:“我们的客户希望在现有边缘基础设施和工作流程中扩展
    发表于 03-21 11:31 301次阅读
    <b class='flag-5'>英特尔</b>借助开放生态系统,<b class='flag-5'>加速</b>边缘<b class='flag-5'>AI</b>创新

    英特尔赋能DeepSeek本地运行,助力汽车升级“最强大脑”

    提升GPU内存的利用率。这一突破DeepSeek技术在汽车领域的应用开辟了新路径。 随着第二代英特尔锐炫™B系列车载独立显卡的发布,所支持Dee
    的头像 发表于 02-17 09:37 968次阅读

    探索座舱“未至之境”:英特尔支持DeepSeek车内本地运行

    车载独立显卡的发布,更是将能支持的模型参数推至32B。当下经典的AI驾舱应用,比如,驾驶员与AI助手讨论明天的行程,关于沿途各种地标的语音交互,乃至于如语音调节温度、问询操作指引等经典应用场景,由于
    的头像 发表于 02-14 16:19 607次阅读
    探索座舱“未至之境”:<b class='flag-5'>英特尔</b><b class='flag-5'>支持</b><b class='flag-5'>DeepSeek</b>车内本地运行

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型进行了深度优化。 这一优化举措使得AI开发者能够以更低的成本和更高的效率实现复杂任务的部署与优化。英特尔Gaudi 2D AI
    的头像 发表于 02-10 11:10 923次阅读

    DeepSeek发布Janus Pro模型,英特尔Gaudi 2D AI加速器优化支持

    Gaudi 2D AI加速器现已针对该模型进行了全面优化。这一优化举措使得AI开发者能够更轻松地实现复杂任务的部署与优化,从而有效满足行业应
    的头像 发表于 02-08 14:35 908次阅读

    英特尔酷睿Ultra处理支持DeepSeek运行

    Janus-Pro更是将其多模态的本领发挥至极。DeepSeek模型因其高效、易部署等特性,非常适合在英特尔AI PC进行本地化应用。
    的头像 发表于 02-08 10:13 1322次阅读

    使用英特尔AI PCYOLO模型训练加速

    之后,情况有了新的变化,PyTorch2.5正式开始支持英特尔显卡,也就是说,此后我们能够借助英特尔 锐炫 显卡来进行模型训练了。
    的头像 发表于 12-09 16:14 2096次阅读
    使用<b class='flag-5'>英特尔</b><b class='flag-5'>AI</b> PC<b class='flag-5'>为</b>YOLO模型训练<b class='flag-5'>加速</b>

    英特尔推出全新英特尔锐炫B系列显卡

    备受玩家青睐的价格提供卓越的性能与价值1,很好地满足现代游戏需求,并为AI工作负载提供加速。其配备的英特尔Xe矩阵计算引擎(XMX),
    的头像 发表于 12-07 10:16 1913次阅读
    <b class='flag-5'>英特尔</b>推出全新<b class='flag-5'>英特尔</b>锐炫B系列显卡