0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

沐曦股份曦云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

沐曦MetaX 来源:沐曦MetaX 2025-12-17 14:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型,沐曦股份曦云C系列GPU完成Day 0适配。

GLM-4.6V 系列多模态大模型共包含两款模型:

GLM-4.6V(106B-A12B):面向云端与高性能集群场景的基础版;

GLM-4.6V-Flash(9B):面向本地部署与低延迟应用的轻量版。

作为 GLM 系列在多模态方向上的一次重要迭代,GLM-4.6V 将训练时上下文窗口提升到 128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

1原生多模态工具调用

传统工具调用大多基于纯文本,在面对图像、视频、复杂文档等多模态内容时,需要多次中间转换,带来信息损失和工程复杂度。

GLM-4.6V 从设计之初就围绕「图像即参数,结果即上下文」,构建了原生多模态工具调用能力:

输入多模态:图像、截图、文档页面等可以直接作为工具参数,无需先转为文字描述再解析,减少链路损耗。

输出多模态:对于工具返回的统计图表、渲染后网页截图、检索到的商品图片等结果,模型能够再次进行视觉理解,将其纳入后续推理链路。

模型原生支持基于视觉输入的工具调用,完整打通从感知到理解到执行的闭环。这使得 GLM-4.6V 能够应对图文混排输出、商品识别与好价推荐、以及辅助型 Agent 场景等更复杂的视觉任务。

2同规模开源 SOTA

GLM-4.6V 在 MMBench、MathVista、OCRBench 等30+ 主流多模态评测基准上进行了验证,较上一代模型取得显著提升。在同等参数规模下,模型在多模态交互、逻辑推理和长上下文等关键能力上取得SOTA表现。

c41842d8-d4ff-11f0-8c8f-92fbcf53809c.png

3MXMACA 软件栈加速国产模型落地

MXMACA 软件栈作为沐曦股份全栈 GPU 解决方案的核心,在vLLM, sglang 等主流AI推理框架中展现出快速适配的优势,其 GPU 架构和优化设计和良好的生态兼容性确保了高效、灵活的推理部署。此次沐曦股份曦云 C 系列GPU完成 Day 0 适配智谱 GLM-4.6V 系列多模态大模型再次印证了这一优势。MXMACA 软件栈将继续以开放式架构和持续迭代优化,赋能推理框架、模型、应用开发到运维的全生命周期,助力开发者构建更具竞争力的 AI 产品。

关于沐曦股份

沐曦股份致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5115

    浏览量

    134540
  • 沐曦
    +关注

    关注

    1

    文章

    59

    浏览量

    1664
  • 大模型
    +关注

    关注

    2

    文章

    3485

    浏览量

    5024

原文标题:沐曦股份曦云C系列GPU Day 0适配智谱GLM-4.6V

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DLInfer联手股份实现数据生成场景的实际落地

    近期,上海 AI 实验室 DeepLink 团队推出的 DLInfer 通过支持 LMDeploy 主流模型推理,助力股份
    的头像 发表于 12-09 14:55 406次阅读
    DLInfer联手<b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>实现数据生成场景的实际落地

    瀚海量子与股份达成战略合作 量子计算软件领军者+高性能GPU芯片领军者

    当量子计算软件领军者遇上高性能GPU芯片领军者,国产算力领域迎来一项重磅合作。 近日, 合肥瀚海量子科技有限公司(简称“瀚海量子”)与集成电路(上海)股份有限公司(简称“
    的头像 发表于 11-24 19:02 2336次阅读

    股份与上海电信完成首期GPU生态专家认证培训

    近期,集成电路(上海)股份有限公司(以下简称“股份”)携手上海电信天翼
    的头像 发表于 10-31 10:33 289次阅读

    强强联合:之江实验室与股份共建智算集群联合实验室

    总工程师赵志峰、副主任何水兵,以及股份联合创始人、CTO兼首席硬件架构师彭莉等双方代表出席签约仪式。 本次合作旨在响应国家“人工智能+”行动号召,落实浙江省打造人工智能高地的战略部署。双方将围绕算力、数据、
    的头像 发表于 10-23 10:50 1086次阅读

    首款全国产通用GPU芯片发布 集成推出C600

    集成电路(南京)有限公司近日正式发布了首款全国产通用GPU——C600,这标志着国产高性
    的头像 发表于 10-19 20:04 4.5w次阅读

    GPU与龙蜥操作系统完成适配

    集成电路(上海)股份有限公司(以下简称"")于 2020 年 9 月成立于上海,其拥有技术完备、设计和产业化经验丰富的团队,曾主导过
    的头像 发表于 10-17 15:06 864次阅读

    C系列产品已支持TileLang

    近日,DeepSeek宣布在其新版本中拥抱国产GPU语言TileLang,引发业界广泛关注。作为国产高性能GPU的代表,
    的头像 发表于 10-14 09:25 765次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b><b class='flag-5'>系列</b>产品已支持TileLang

    硅基流动携手首发基于的Kimi K2推理服务

    今天,硅基流动联合集成电路(上海)股份有限公司(简称“”),全球首发基于
    的头像 发表于 07-23 17:33 1593次阅读

    PaddleScience完成与AI芯片适配

    当前,PaddleScience已与展开深度合作,涵盖智能仿真、高性能计算、科学建模等多个方向。这一趋势正加速形成面向"Al for Science"的国产智算生态新格局。
    的头像 发表于 05-06 14:49 1420次阅读

    C500通用计算GPU与百度飞桨完成Ⅱ级兼容性测试

    近日,C500通用计算GPU与百度飞桨已完成Ⅱ级兼容性测试。测试结果显示,双方兼容性表现
    的头像 发表于 03-31 14:22 1531次阅读

    加速DeepSeek满血版单卡C500异构推理

    近日,基于开源KTransformers架构的 CPU/GPU 异构推理能力,C500
    的头像 发表于 03-20 15:52 1945次阅读

    Gitee AI 联合首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

    、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的 DeepSeek 模型。值得关注的是, 本次上线的四个模型均部署在国产
    的头像 发表于 02-10 09:56 1117次阅读
    Gitee AI 联合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首发全套 DeepSeek R1 千问蒸馏<b class='flag-5'>模型</b>,全免费体验!

    GLM-PC 开放体验,模态 Agent 升级

    1月23日,北京智华章科技有限公司宣布旗下智GLM-PC开放体验,标志着自主操作电脑的模态Agent迎来重要升级。
    的头像 发表于 01-24 14:10 1225次阅读

    澎峰科技与完成联合测试,实现全面兼容

    近日,澎峰科技与科技宣布,双方已完成对PerfXLM推理引擎、PerfXCloud大模型服务平台与
    的头像 发表于 01-21 15:20 996次阅读

    澎峰科技计算软件栈与GPU完成适配和互认证

    ‍近期,澎峰科技与完成了对PerfXLM(推理引擎)、PerfXCloud(大模型服务平台)与
    的头像 发表于 01-21 09:51 1232次阅读