0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

章鹰观察 来源:章鹰观察 作者:章鹰 2026-04-26 16:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2026年,AI工作站的定位正在发生根本性转变,从辅助性的开发工具,演变为企业实现数据安全和高效运营的“本地AI工厂”。IDC预测,2026年工作站市场出货量预计将达到66万台,同比增长5.2%。为了满足不同规模和场景的企业需求,AI工作站的形态也日趋多元化,一体机方案兴起,扩展到更紧凑的“迷你主机”和桌面式工控机。在AI大模型和智能体应用的推动下,AI工作站的芯片方案有哪些最新突破呢?

4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:英特尔® 至强600工作站处理器与英特尔锐炫™ Pro B70、B65 GPU

为何至强600处理器能快速赋能AI工作站?锐炫B70有哪些代际的性能优势和适用场景?英特尔中国区技术部总经理高宇、英特尔中国区显卡和AI高级产品总监徐金平和英特尔技术专家 王巍巍给我们带来最新的解读。

AI工作站市场井喷发展,英特尔推出至强处理器赋能多元化部署需求

“当下,用户对AI算力需求持续增高,但是另外一方面是用户希望算力平台可以降低部署门槛,减少运维成本。AI工作站的产品特性很好满足了用户需求。实时交互、人机友好,性能稳定,不少工作站采用服务器技术,可以充分满足企业对AI推理和私有化部署的需求。” 高宇分析说。

至强600处理器具备三大特性:1、高性能,至强600处理器如旗舰型号至强698X配备了高达86个性能核(P-core),多线程性能较上代提升61%,睿频最高可达4.8GHz。在处理复杂的科学计算、工程仿真或作为AI任务的调度中心时,这种强大的CPU算力能确保系统稳定高效运行。至强600的每个核心都内置了英特尔AMX(高级矩阵扩展)引擎,并新增了对FP16数据类型的原生支持。这使得它在处理AI推理和机器学习负载时,性能相比前代提升高达17%,尤其在图像降噪等特定场景下速度可提升4-5倍。

2、高内存。至强600系列最高支持高达4TB的ECC内存,并拥有8个内存通道,支持128条PCle5.0通道,配合芯片组,为工作站提供丰富灵活的扩展能力,这对于需要加载超大规模数据集或运行多个巨型AI模型的企业级应用至关重要。英特尔至强600系列处理器支持的MRDIMM内存技术,MRDIMM数据传输速率得到了极大提高。在至强600系列处理器上,MRDIMM的速率可达8000 MT/s,相比标准DDR5 RDIMM的6400 MT/s,峰值带宽提升了近40%。

3、高可用。英特尔将服务器上的RAS技术下放到工作站,为了把至强上的计算引擎做好,我们的OneAPI、OpenVINO也都可以把我们底层的AI能力封装成一个好用的接口,让算法特别容易的移植。依托英特尔vPro® 技术体系,支持多种管理特性、多密钥内存加密与一键恢复等企业级功能,满足企业灵活运维的要求。

“任何一个AI推理系统都不是单一的模型,它是多个模型组合的结果,再加上智能体的阶段调用,它都需要强大的CPU技术,由于至强600具备高性能,可以将一些小模型用CPU来处理,而把更大的模型留给GPU来处理,这样令至强600赋能的AI工作站性能比原来有大幅度提升,至强600平台式地表AI工作站里面最强的选择。”高宇指出。

AI推理市场突飞猛进,英特尔Pro B70实现代际跃升

此外,英特尔还发布了锐炫B70 GPU,该芯片基于第二代Xe2架构,配备32GB GDDR6显存,搭载32个Xe核心,AI算力峰值高达367 TOPS,在AI推理场景中支持更大规模的AI模型与更长的上下文窗口,满足图形渲染、通用并行计算与AI加速计算等专业工作负载的需求。


32GB 的大显存使其能够轻松加载和运行如 Qwen3.5-122B 等百亿、千亿级参数的大模型,并支持更长的文本输入,这对于智能体(Agent)等复杂应用至关重要。

“玩龙虾,官方推荐GPU最少支持64K上下文窗口,真正要达到好效果,最好支持80K、90K上下文,32GB的大显存支持93K上下文,对龙虾就非常友好。锐炫Pro B70的大显存、长窗口、高并发,再加上展示了很多AIGC能力、养龙虾的能力,让大家印象深刻。”高宇分析说。

英特尔官方数据显示,与竞品 NVIDIA RTX Pro 4000 相比,锐炫 Pro B70 在 AI 推理任务中展现出显著优势:上下文窗口支持高达 2.2 倍 的更大上下文窗口。Token 吞吐量:在多用户工作负载下,吞吐量高出 85%。首字延迟:首个 Token 的生成延迟降低至 1/6.2,响应速度更快。英特尔中国区显卡和AI高级产品总监徐金平表示,锐炫B70 Pro的核心价值在于,它通过大显存和高并发处理能力,让在本地工作站上流畅运行大型、复杂的 AI 模型成为可能,个人和企业的智能体AI的蓬勃发展,英特尔现在有着CPU+GPU的方案,非常“至强600+锐炫B70 Pro”,是专门为这个时代打造的.

联想展台展出了AI工作站ThinkStation P7,搭载2张Intel Arc ProB70专业显卡,本地高效运行z-image-turbo文生图、wan2.2-14B图生视频模型,为图文视频创作大幅度提高效率。

现场展区里面,深圳触动互联科技展示企业智能体一体机,展台人员介绍,依托新一代Xeon 600多核心高内存代开特性,在企业本地部署高密度的数字员工智能体集群,并企业基于4卡B70运行本地100B级参数级别大模型,与云端大脑互补,分别承担不同级别的企业任务。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10322

    浏览量

    181086
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,联动重塑AI工作站格局

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,推出英特尔® 至强® 600工作站处理器与
    的头像 发表于 04-24 09:28 3244次阅读
    <b class='flag-5'>英特尔</b>发布至强600系列<b class='flag-5'>工作站</b>处理器与锐炫Pro B70 GPU,<b class='flag-5'>双</b><b class='flag-5'>芯</b>联动重塑<b class='flag-5'>AI</b><b class='flag-5'>工作站</b>格局

    英特尔“智能体PC”登场:AI硬件革命迈入混合架构新纪元

    近日,在AI技术从云端向终端加速渗透的转折点上,英特尔在北京举办的混合AI部署方案分享会上抛出一枚重磅炸弹——正式提出“智能体PC”概念。这
    的头像 发表于 04-22 10:36 504次阅读

    每台智能体PC,都是AI时代的新入口

    AI对个人计算的变革,正从“工具增强”迈入“智能伙伴”的新阶段。依托于英特尔® 酷睿™ Ultra和英特尔® 酷睿™ 处理器提供的强大本地AI
    的头像 发表于 04-21 22:23 6443次阅读
    每台智能体PC,都是<b class='flag-5'>AI</b>时代的新入口

    盾时代助企业破解智能体Token失控难题

    2026年,随着OpenClaw等自主智能体(Agent)技术的爆发,企业AI应用正经历从“对话问答”到“自主执行”的跃迁。为了占得智能体应用先机,企业纷纷给员工下发Token额度、鼓励全员“
    的头像 发表于 03-28 13:40 1047次阅读

    科技云报到:“龙虾”入笼:为何金融行业不敢“”?

    科技云报到:“龙虾”入笼:为何金融行业不敢“”?
    的头像 发表于 03-27 09:38 350次阅读

    自主CPU平台实现OpenClaw高效部署

    随着“虾”成为AI落地实操的热门趋势,搭载兆开先系列处理器的信创电脑、搭载开胜系列处理器的工作站等产品,以自主算底座+
    的头像 发表于 03-17 17:40 2982次阅读
    兆<b class='flag-5'>芯</b>自主CPU平台实现OpenClaw高效部署

    登临科技GPU本地部署OpenClaw全攻略

    ”在本地,不仅可以大幅度节省token消耗量,而且可以实现数据隐私、低延迟等诸多优势。 登临KS20 GPU 凭借其强大的端侧算和CUDA兼容优势,成为解锁
    的头像 发表于 03-17 14:19 2190次阅读
    登临科技GPU<b class='flag-5'>本地</b>部署OpenClaw全攻略

    让OpenClaw化身专属数字员工,N602 Mini PC助你“安全龙虾

    最近、不管是朋友圈、短视频平台还是各类社群,都在疯传一个词:OpenClaw龙虾,它就像龙虾的钳子一样“抓取”、“操控”电脑任务,能主动帮你清理收件箱、预订会议、整理日程,甚至处理重复性工作
    的头像 发表于 03-13 20:06 648次阅读
    让OpenClaw化身专属数字员工,N602 Mini PC助你“安全<b class='flag-5'>养</b><b class='flag-5'>龙虾</b>”

    龙虾的隐藏成本:选对电源,让 AI 助手更省钱更靠谱

    最近全网都在跟风 “龙虾”,这款名叫 OpenClaw 的开源 AI 智能体,凭着能真正 “动手干活” 的本事彻底火了 —— 不用手动操作,它就能帮着整理文件、写报表、打理线上账号,甚至还能辅助做
    的头像 发表于 03-13 10:34 642次阅读
    <b class='flag-5'>养</b><b class='flag-5'>龙虾</b>的隐藏成本:选对电源,让 <b class='flag-5'>AI</b> 助手更省钱更靠谱

    英特尔创新引领AI NAS:软硬结合引领本地数据智慧管理与多场景创新应用

    2025年12月3日,西安 —— 2025英特尔AI NAS 解决方案峰会今日成功举行。围绕“生万象 智存未来”的主题,英特尔携手生态伙伴及三十余家渠道客户,共同展望
    的头像 发表于 12-12 15:45 726次阅读
    <b class='flag-5'>英特尔</b>创新引领<b class='flag-5'>AI</b> NAS:软硬结合引领<b class='flag-5'>本地</b>数据智慧管理与多场景创新应用

    英特尔举办行业解决方案大会,共同打造机器人“”动脉

    具身智能和机器人应用提供强大算支持。会上,英特尔携手普联技术、海石商用、海信医疗、阿丘科技等众多的生态伙伴,共同分享了丰富的行业应用成果,携手勾勒出端侧AI领域的未来发展新蓝图。
    的头像 发表于 11-19 21:51 7105次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“<b class='flag-5'>芯</b>”动脉

    发力图形工作站AI推理市场,英特尔大显存GPU亮相湾

    英特尔发布了面向专业的锐炫Pro B50和B60。这两款显卡比较RTX2000和5660Ti,有哪些性能上的优势?在支持AI推理工作站和大模型部署上,B60有哪些独到之处?10月16日,在深圳举行的湾区半导体大会上,
    的头像 发表于 10-22 13:40 1.2w次阅读
    发力图形<b class='flag-5'>工作站</b>和<b class='flag-5'>AI</b>推理市场,<b class='flag-5'>英特尔</b>大显存GPU亮相湾<b class='flag-5'>芯</b>展

    一张卡当两张用?英特尔携手铭瑄推出锐炫B60“一卡”显卡

    ,也能释放出色的AI推理算。 方寸之间,GPU显存密度的突破 相比于千年前荔枝的“冷链”难题,英特尔更聚焦于“方寸之间”如何巧妙组合。当前主流工作站体积普遍维持在50升左右,虽小于服
    的头像 发表于 07-23 15:58 769次阅读
    一张卡当两张用?<b class='flag-5'>英特尔</b>携手铭瑄推出锐炫B60“一卡<b class='flag-5'>双</b><b class='flag-5'>芯</b>”显卡

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔
    的头像 发表于 05-21 00:57 7755次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI工作站迎来新选择

    Pro B50 GPU,搭载了为AI推理和专业工作站量身定制的配置,扩展了英特尔锐炫Pro产品系列。 英特尔 ® Gaudi 3 AI 加速
    发表于 05-20 11:03 1917次阅读