2026年,AI工作站的定位正在发生根本性转变,从辅助性的开发工具,演变为企业实现数据安全和高效运营的“本地AI工厂”。IDC预测,2026年工作站市场出货量预计将达到66万台,同比增长5.2%。为了满足不同规模和场景的企业需求,AI工作站的形态也日趋多元化,一体机方案兴起,扩展到更紧凑的“迷你主机”和桌面式工控机。在AI大模型和智能体应用的推动下,AI工作站的芯片方案有哪些最新突破呢?
4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:英特尔® 至强600工作站处理器与英特尔锐炫™ Pro B70、B65 GPU。

为何至强600处理器能快速赋能AI工作站?锐炫B70有哪些代际的性能优势和适用场景?英特尔中国区技术部总经理高宇、英特尔中国区显卡和AI高级产品总监徐金平和英特尔技术专家 王巍巍给我们带来最新的解读。
AI工作站市场井喷发展,英特尔推出至强处理器赋能多元化部署需求
“当下,用户对AI算力需求持续增高,但是另外一方面是用户希望算力平台可以降低部署门槛,减少运维成本。AI工作站的产品特性很好满足了用户需求。实时交互、人机友好,性能稳定,不少工作站采用服务器技术,可以充分满足企业对AI推理和私有化部署的需求。” 高宇分析说。

至强600处理器具备三大特性:1、高性能,至强600处理器如旗舰型号至强698X配备了高达86个性能核(P-core),多线程性能较上代提升61%,睿频最高可达4.8GHz。在处理复杂的科学计算、工程仿真或作为AI任务的调度中心时,这种强大的CPU算力能确保系统稳定高效运行。至强600的每个核心都内置了英特尔AMX(高级矩阵扩展)引擎,并新增了对FP16数据类型的原生支持。这使得它在处理AI推理和机器学习负载时,性能相比前代提升高达17%,尤其在图像降噪等特定场景下速度可提升4-5倍。
2、高内存。至强600系列最高支持高达4TB的ECC内存,并拥有8个内存通道,支持128条PCle5.0通道,配合芯片组,为工作站提供丰富灵活的扩展能力,这对于需要加载超大规模数据集或运行多个巨型AI模型的企业级应用至关重要。英特尔至强600系列处理器支持的MRDIMM内存技术,MRDIMM数据传输速率得到了极大提高。在至强600系列处理器上,MRDIMM的速率可达8000 MT/s,相比标准DDR5 RDIMM的6400 MT/s,峰值带宽提升了近40%。
3、高可用。英特尔将服务器上的RAS技术下放到工作站,为了把至强上的计算引擎做好,我们的OneAPI、OpenVINO也都可以把我们底层的AI能力封装成一个好用的接口,让算法特别容易的移植。依托英特尔vPro® 技术体系,支持多种管理特性、多密钥内存加密与一键恢复等企业级功能,满足企业灵活运维的要求。
“任何一个AI推理系统都不是单一的模型,它是多个模型组合的结果,再加上智能体的阶段调用,它都需要强大的CPU技术,由于至强600具备高性能,可以将一些小模型用CPU来处理,而把更大的模型留给GPU来处理,这样令至强600赋能的AI工作站性能比原来有大幅度提升,至强600平台式地表AI工作站里面最强的选择。”高宇指出。
AI推理市场突飞猛进,英特尔Pro B70实现代际跃升
此外,英特尔还发布了锐炫B70 GPU,该芯片基于第二代Xe2架构,配备32GB GDDR6显存,搭载32个Xe核心,AI算力峰值高达367 TOPS,在AI推理场景中支持更大规模的AI模型与更长的上下文窗口,满足图形渲染、通用并行计算与AI加速计算等专业工作负载的需求。

32GB 的大显存使其能够轻松加载和运行如 Qwen3.5-122B 等百亿、千亿级参数的大模型,并支持更长的文本输入,这对于智能体(Agent)等复杂应用至关重要。
“玩龙虾,官方推荐GPU最少支持64K上下文窗口,真正要达到好效果,最好支持80K、90K上下文,32GB的大显存支持93K上下文,对龙虾就非常友好。锐炫Pro B70的大显存、长窗口、高并发,再加上展示了很多AIGC能力、养龙虾的能力,让大家印象深刻。”高宇分析说。

英特尔官方数据显示,与竞品 NVIDIA RTX Pro 4000 相比,锐炫 Pro B70 在 AI 推理任务中展现出显著优势:上下文窗口支持高达 2.2 倍 的更大上下文窗口。Token 吞吐量:在多用户工作负载下,吞吐量高出 85%。首字延迟:首个 Token 的生成延迟降低至 1/6.2,响应速度更快。英特尔中国区显卡和AI高级产品总监徐金平表示,锐炫B70 Pro的核心价值在于,它通过大显存和高并发处理能力,让在本地工作站上流畅运行大型、复杂的 AI 模型成为可能,个人和企业的智能体AI的蓬勃发展,英特尔现在有着CPU+GPU的方案,非常“至强600+锐炫B70 Pro”,是专门为这个时代打造的.

联想展台展出了AI工作站ThinkStation P7,搭载2张Intel Arc ProB70专业显卡,本地高效运行z-image-turbo文生图、wan2.2-14B图生视频模型,为图文视频创作大幅度提高效率。

现场展区里面,深圳触动互联科技展示企业智能体一体机,展台人员介绍,依托新一代Xeon 600多核心高内存代开特性,在企业本地部署高密度的数字员工智能体集群,并企业基于4卡B70运行本地100B级参数级别大模型,与云端大脑互补,分别承担不同级别的企业任务。
-
英特尔
+关注
关注
61文章
10322浏览量
181086
发布评论请先 登录
英特尔“智能体PC”登场:AI硬件革命迈入混合架构新纪元
芯盾时代助企业破解智能体Token失控难题
登临科技GPU本地部署OpenClaw全攻略
让OpenClaw化身专属数字员工,N602 Mini PC助你“安全养龙虾”
养龙虾的隐藏成本:选对电源,让 AI 助手更省钱更靠谱
英特尔创新引领AI NAS:软硬结合引领本地数据智慧管理与多场景创新应用
英特尔举办行业解决方案大会,共同打造机器人“芯”动脉
发力图形工作站和AI推理市场,英特尔大显存GPU亮相湾芯展
一张卡当两张用?英特尔携手铭瑄推出锐炫B60“一卡双芯”显卡
直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍
AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑
评论