0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

太初元碁:40+AI大模型全覆盖,新版本即发即适配、上线即可用,实现国产“芯”速度

Carol Li 来源:电子发烧友网 作者:电子发烧友 2026-02-25 09:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,国产AI芯片企业太初(无锡)电子科技有限公司(又称“太初元碁”)完成智谱GLM-5.0、阿里千问Qwen3.5-397B-A17B等大模型的深度适配,截至目前,其已完成包括DeepSeek、Qwen、GLM、Intern-S1、文心等在内的40+AI大模型的即发即适配,上线即可用,涵盖了DeepSeek、Qwen 、GLM、Seed-OSS、文心一言系列大语言模型、BAAI Embedding / Reranker系列向量模型、Qwen-VL、LLaVA系列多模态理解模型;Stable-Diffusion、FLUX、Wan系列等多模态生成类模型;MinerU、DeepSeek-OCR、Paddle-OCR等主流OCR模型;以及Intern-S1科学多模态大模型。

自2026年元旦以来,多家知名企业纷纷宣布更新国产大模型,大模型进入“周更”时代,而算力底座的响应速度也决定了生态话语权。换言之,留给国产AI芯片的时间并不多了。一位业内人士表示,软件定义硬件的趋势日益明显。“过去我们习惯的芯片设计流程是先集中全力把硬件设计出来,然后软件团队投入大量人力去建设和完善各种软件栈将硬件性能发挥出来,实现软硬件协同。但以DeepSeek、智谱、千问等大模型大规模成功应用,让我们看到了变化。”

以太初元碁为例,除了在极短时间完成各大模型的快速适配之余,其也就软硬件协同问题在持续发力。据介绍,在主流大模型适配过程中,太初元碁针对不同开发者的技术能力差异,在SDAA软件栈中推出了阶梯式开发工具链,全面覆盖从入门到高阶的多元化开发需求。该工具链能够帮助开发者快速构建高性能算子,实现与主流AI生态的无缝兼容,显著降低CUDA生态迁移的技术门槛与成本。

“一方面,面向不同开发者我们提供了多种开发高性能算子工具,比如SDAA Copilot、Teco-Triton、SDAA C以及PCX虚拟指令集等;另一方面,我们通过Teco-vLLM高度适配自研AI加速卡从而实现零成本兼容AI主流任务。”太初元碁相关负责人介绍道。据悉,SDAA Copilot专注于加速卡算子智能生成的AI编程大模型,小时级别生成3000个SDAA算子代码生成并通过单测;开发者使用熟悉的Triton的Python抽象语法树快速、灵活的编写高性能算子,Teco-Triton后端无缝运行在太初元碁加速卡;SDAA编程模型支持C/C++标准语法,让开发者可以直接使用进行内核开发;PCX虚拟指令集深度匹配太初元碁的硬件特性,支持用户在SDAA C程序中嵌入PCX指令,实现对关键计算路径的精细优化。同时,Teco-vLLM通过插件机制,将太初AI加速卡接入vLLM框架,实现与原生vLLM完全一致的推理接口和方法,基于GPU开发的vLLM原生应用无需修改模型代码和启动方式,即可无缝迁移至太初元碁硬件运行,降低生态切换成本。

太初元碁首席产品官洪源在接受记者采访时表示,突破集群性能、追求极致推理性价比、加速生态和软件工具建设将成为国产AI芯片企业的三大主攻方向。“大模型训练本质上是大数据量的‘分布式并行计算’,互联能力就是分布式计算的数据传输‘高速公路’。前沿大模型的训练已经要求数万张算力卡的互联并行工作,国产AI芯片厂商不能只关注单卡性能,需要充分考虑如何构建产品真正的集群性能,”洪源说道,“现阶段对于大模型厂商和云服务厂商而言,每Token对应的成本将有可能决定产品的‘生死’,所以性价比将成为推理任务的极致追求。最后是生态的挑战,让我们国产AI芯片在最终客户侧落地时,必须回答并彻底解决一个实际问题,如何帮助用户甚至让用户无感的从CUDA生态迁移过来。”

在大模型没有进入“周更”时代前,或许国产AI芯片企业还能放慢脚步,慢慢观察再决定接下来要怎么走。然而,现在已然没有太多的时间,国产算力企业真正的大考来临,谁能真正拓展生态,让产品在具体场景下落地,才能在未来继续“活”下来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI芯片
    +关注

    关注

    17

    文章

    2164

    浏览量

    36865
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    昆仑科技完成MiniMax M2.7模型极速适配

    今日,MiniMax正式开源MiniMax M2.7模型。昆仑同步完成对该模型的Day 0适配与深度优化,成为首批实现
    的头像 发表于 04-13 17:07 468次阅读

    ASPICE 3.1 与 4.0 版本的核心差异:从软件专属到全系统覆盖(四)

    迭代升级 除了新增硬件过程组,4.0 版本还完成了多项关键优化: 1.新增 MLE 机器学习工程过程组,包含 5 个核心过程,覆盖 AI 算法、机器学习模型的研发
    发表于 04-08 09:48

    香橙派志系列开发板适配OpenClaw教程

    普惠新篇章:香橙派志系列开发板全面拥抱OpenClaw时代 AI智能体正加速从概念走向普及,但高性能硬件的门槛是否让许多创新者望而却步?香橙派志系列开发板现已全面适配OpenCla
    发表于 02-25 18:29

    国产AI Coding上线:摩尔线程+硅基流动+智谱,强强联合!

    基流动推理加速引擎,并集成 GLM-4.7 顶尖代码模型,成功实现国产芯片与国产模型AI
    的头像 发表于 02-03 17:07 1941次阅读
    <b class='flag-5'>全</b>栈<b class='flag-5'>国产</b><b class='flag-5'>AI</b> Coding<b class='flag-5'>上线</b>:摩尔线程+硅基流动+智谱,强强联合!

    蔚来世界模型NWM全新版本使用指南

    今天,「蔚来世界模型 NWM」全新版本正式开启推送。首批超过46万辆「Banyan 榕」车型将陆续收到推送。「Cedar 雪松」和「Cedar S 雪松」车型,也将于近期推送。此次,蔚来率先将「世界
    的头像 发表于 01-29 09:13 794次阅读

    蔚来世界模型NWM全新版本正式推送

    2026年1月28日,「蔚来世界模型 NWM」全新版本正式开启推送,首批将为超过46万辆「Banyan 榕」车型推送。「Cedar 雪松」车型及「Cedar S 雪松」车型,也将于近期开启推送。
    的头像 发表于 01-28 15:38 570次阅读

    中科曙光AI超集群系统和scaleX640超节点等产品全面适配DeepSeek V3.2

    实现“跨层协同”,曙光AI超集群系统、scaleX640超节点等产品0day完成对DeepSeek新版本的深度适配与调优,支持各行各业客户进行
    的头像 发表于 12-05 14:32 935次阅读

    如何使用新版本J-Flash编程CW32 MCU

    1、从Segger公司官网下载安装最新版本JLink驱动,比如V7.96a,安装目录下没有JLinkDevices.xml文件。 2、在C:Users<用户名>
    发表于 11-12 07:24

    曙光AI超集群系统全面支持DeepSeek-V3.2-Exp

    9月29日,DeepSeek-V3.2-Exp正式发布并开源,引入创新的稀疏Attention架构。基于中国首个AI计算开放架构,芯片层、软件层、模型实现“跨层协同”,使得曙光AI
    的头像 发表于 09-30 16:18 1859次阅读

    中科曙光助力紫东太初4.0大模型重磅发布

    近日,全球首个“深度推理+多模态”大模型——“紫东太初”4.0在2025东湖国际人工智能高峰论坛上正式发布。中科曙光作为核心生态伙伴,依托中国首个AI计算开放架构,为“紫东太初”4.0
    的头像 发表于 09-24 09:33 807次阅读

    transcosmos在中国发布渠道智能客服平台&quot;transCxLink&quot;3.0版本

    渠道智能客服平台"transCxLink"3.0版本,这一全新版本在继承前代产品优势的基础上,结合当前最新的AI模型技术,实现了更多客服功
    的头像 发表于 07-02 09:43 641次阅读
    transcosmos在中国发布<b class='flag-5'>全</b>渠道智能客服平台&quot;transCxLink&quot;3.0<b class='flag-5'>版本</b>

    戴尔数据保护软件迎来全新版本

    无缝运行的异常检测,一站式监控多达150个系统,额外的MFA多重身份验证Dell PowerProtect Data Manager19.19全新版本现已到来!
    的头像 发表于 06-27 13:55 1061次阅读

    全新AMD Vitis统一软件平台2025.1版本发布

    全新 AMD Vitis 统一软件平台 2025.1 版正式上线!此最新版本为使用 AMD Versal AI 引擎的高性能 DSP 应用提供了改进后的设计环境。
    的头像 发表于 06-24 11:44 1931次阅读

    普华基础软件开源汽车操作系统新版本代码上线

    近日,第二十一届上海国际汽车工业展览会现场,开源车用操作系统新版本代码上线仪式在中国电科展台成功召开。全球首个开源智能驾驶操作系统微内核龘EasyAda V2.1和首个规模化、量产级安全车控操作系统
    的头像 发表于 04-30 09:17 1146次阅读

    普华基础软件开源车用操作系统迎来全新版本

    近日,普华基础软件开源车用操作系统媒体发布会在上海中国汽车会客厅召开——全球首个开源智能驾驶操作系统微内核龘EasyAda、开源安全车控操作系统小满EasyXMen全新版本正式发布。现场,普华基础软件开源项目技术团队专家就开源项目新版本技术亮点、新增功能及社区治理与运营等
    的头像 发表于 04-25 16:18 1121次阅读