0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

寒武纪思元290芯片发布,具有三大关键亮点

我快闭嘴 来源:中国电子报 作者:李佳师 2021-01-25 14:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

寒武纪在官网披露7纳米AI训练芯片思元 290 智能芯片及加速卡、玄思1000智能加速器相关信息,并表示该系列产品去年已经实现规模化出货。该披露信息中有几个关键词:“7nm””量产”“AI训练芯片”。网友评价寒武纪太低调了,其他AI芯片大厂发布一颗7纳米芯片,得开各种发布会让全世界知道,而寒武纪只是在官网披露一下,没有任何其他动作。

异常低调的发布

记者查看了寒武纪创始人陈天石的微信,他只是于昨天早上9:02分在微信朋友圈发布了一条只有9个字的信息“思元290正式亮相”,转发的是寒武纪公司公众号内容,非常低调。但这并不影响资本市场的敏感嗅觉,昨天寒武纪的股价上涨了17.73%,收报170元。随着寒武纪的训练产品线集中亮相,寒武纪从训练芯片到云、边、端等业务布局已经清晰呈现。

思元290芯片以及这些加速卡为何物?在AI芯片市场处于什么样的地位?对于寒武纪与业界有什么突破价值?

人工智能芯片有很多种分类方法:按功能来说,分为训练芯片和推理芯片;按应用场景来说,分为云端和终端芯片;按照技术架构来说,分为冯诺依曼架构和非冯架构芯片,诸如类脑芯片等。这次寒武纪推出的思元290智能芯片是其首颗训练芯片。为什么要做AI训练芯片? AI训练芯片市场有多大?其红利有多“红”?实际上,看看英伟达公司股价这些年在市场上的“一骑绝尘”,就很好理解。

随着AI算法突飞猛进的发展,越来越多的模型训练需要巨量的算力支撑,才能快速有效实施,可以说算力是人工智能应用取得突破的决定因素。目前,英伟达在全球云端训练芯片市场一家独大,其GPU+CUDA计算平台被认为是最成熟的AI训练方案。此外,还有第三方异构计算平台OpenCL+AMD GPU以及云计算服务商自研加速芯片这两种方案,全球各路芯片厂商基于不同方案,都推出了针对于云端训练的人工智能芯片。

从介绍来看,寒武纪推出的首颗训练芯片思元290,采用台积电7nm制程工艺,集成460亿个晶体管,支持MLUv02扩展架构,全面支持AI训练、推理或混合型人工智能计算加速任务。相比此前寒武纪推出的思元270芯片,思元290芯片可实现峰值算力提升4倍、内存带宽提高12倍、芯片间通讯带宽提高19倍,可提供更优性能功耗比,以及多 MLU 系统的扩展能力。

产品具有标志性意义

思元290芯片有三大关键亮点。

其一采用7纳米工艺制程。目前能够提供7纳米制程芯片的设计企业,除了海思、英伟达等,寒武纪是少数进入这个阵营的创业企业。赛迪顾问集成电路产业研究中心分析师李秧认为,其工艺水平实现7纳米制程,无论在中国还是全球都是比较领先的,而且支持训练。从技术上看是具有标志性意义的。

思元290问世,网友“无关风月”在相关新闻下评论称:“武纪真是低调,发7nm制程的芯片,居然显得如此的平静。目前英伟达的RTX 30系也才用到7nm制程工艺。”工艺越高意味着复杂度也越高,能集成的晶体管数也越多,这次思元290晶体管数超过了460亿个。

网友“无关风月”提及的英伟达RTX 30系列,是去年9月由英伟达创始人兼CEO黄仁勋在自家厨房发布(黄仁勋最近喜欢在家中厨房举行直播发布会),RTX 30基于8纳米工艺由三星代工,黄仁勋认为RTX架构是英伟达有史以来提升最大的产品迭代。

其二是寒武纪的多芯互联技术MLU-Link。目前,算法模型复杂度在不断增加,对算力和训练的速度提出了更高的要求,为了构建更强大的计算平台,需要多芯片之间进行互联。而寒武纪最新推出的多芯互联技术,首次用在了思元290芯片上。有了这个技术,多卡矩阵就可以很轻松地链接起来。业内人士认为,每颗思元290的多芯互联总带宽能达到600GB/s,这个数据与世界上最快的卡相当。同时称,寒武纪的mlulink多芯互联技术应用起来很方便,尤其是对于算力中心,高效而简洁。据介绍,寒武纪首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超过4100万亿次每秒(4.1 PetaOPS INT4),一台玄思 1000 计算单元就足以替代一个小型传统超级计算中心。

其三是寒武纪对应用生态的支撑进一步提速。寒武纪称Neuware提供完善的开发工具包和社区支持,帮助用户在思元290芯片上进行方便、灵活的定制开发及部署工作。

软件平台和工具链是芯片公司构建生态的必备武器,英伟达之所以能够聚集起强大的AI生态,不仅仅是因为其芯片性能强大,与其软件平台和工具链的完善息息相关。某种意义上说,英伟达的“硬实力”得益于其“软”实力,一定也不为过。

寒武纪称,其Neuware软件栈为思元 290 芯片提供完善的软件及应用生态,支持业界主流的TensorFlow和PyTorch等深度学习框架,用户不需要改变使用习惯,即可在思元 290 芯片上实现图形图像、语音、NLP、搜索推荐等多种应用的训练和推理。

寒武纪从终端 IP 场景开始,连续推出了寒武纪1A、寒武纪1H、寒武纪1M 系列处理器,其后布局云端智能芯片及加速卡系列产品思元100和思元270,在2019 年推出基于思元 220 芯片的边缘智能加速卡。由此建立起覆盖云边端、训练、推理的产品矩阵,并打造了平台级基础系统软件Cambricon Neuware。这次发布思元290之后,寒武纪的产品布局就实现了“训推一体、端云融合”。短短几年,寒武纪就成为少数几家全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术的企业。

财报预测仍将持续亏损

此前,有机构希望邀请陈天石去大型会议做演讲,陈天石婉拒并表示目前希望专注把产品和技术做好。或许,对于芯片公司而言,产品是面对市场的核心之剑,做好产品就是最好的宣传。

寒武纪财报显示,2020年上半年营收8720.34万元,同比下降11.01%,亏损2.02亿元,其中研发费用占营收比重为318.1%,同比增加182.69%;去年前三季度营收1.58亿元,同比上涨42.97%,亏损约3.095亿元,研发费用4.33亿元,同比上涨32.78%。财报称,公司预测四季度仍将持续亏损,主要系公司目前仍属于大规模研发投入阶段。

现在是芯片企业最好的时代。埋头苦干,给出更优的产品,或许是芯片企业迎接这个时代最好的姿态。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53534

    浏览量

    459065
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134455
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296556
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261498
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里放大招:自研AI芯片100%国产,不用台积电代工

    电子发烧友网报道(文 / 吴子鹏)8 月 31 日晚间,有消息称阿里云通义千问大模型面临算力缺口,阿里紧急追加寒武纪 370 芯片订单至 15 万片。然而,该消息随后不久便被阿里云
    的头像 发表于 09-03 09:17 1w次阅读

    寒武纪“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    电子发烧友网报道(文/梁浩斌)寒武纪,交出一份炸裂财报!在4月18日,寒武纪公布了2024年年报和2025年一季度报告,其中2024年全年营收11.74亿,同比增长65.56%;亏损4.52亿
    的头像 发表于 04-22 09:07 2534次阅读
    <b class='flag-5'>寒武纪</b>“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    寒武纪3000亿市值与GPU厂商密集IPO,AI芯片正是当打之年

    大涨超9%,股价一度冲至777.77/股,刷新历史新高。并且寒武纪成为除新股外,A股年度涨幅最大的公司,2024年公司累计涨超387%。   但是寒武纪在2024年前季度营收仅为1
    的头像 发表于 01-20 08:16 4509次阅读
    <b class='flag-5'>寒武纪</b>3000亿市值与GPU厂商密集IPO,AI<b class='flag-5'>芯片</b>正是当打之年

    寒武纪引领AI芯片软件新生态

    寒武纪成立的初衷是为“人工智能的大爆发”提供底层算力支持,不仅要硬件算力强大,更要软件通用、易用。多年来,寒武纪坚持训练推理融合、统一的基础软件平台研发策略,构建从自研芯片架构到高性能软件平台的完整
    的头像 发表于 11-06 11:23 723次阅读
    <b class='flag-5'>寒武纪</b>引领AI<b class='flag-5'>芯片</b>软件新生态

    商汤科技与寒武纪达成战略合作

    近日,商汤科技与中科寒武纪科技股份有限公司(以下简称“寒武纪”)签署面向新发展阶段的战略合作协议,重点推进软硬件的联合优化,并共同构建开放共赢的产业生态。
    的头像 发表于 10-15 17:54 526次阅读

    寒武纪成功适配DeepSeek-V3.2-Exp模型

    2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的
    的头像 发表于 10-11 17:14 1173次阅读
    <b class='flag-5'>寒武纪</b>成功适配DeepSeek-V3.2-Exp模型

    寒武纪股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

    今日,寒武纪股价突破1200!8月单月涨幅100%、市值站上5200亿,成为继贵州茅台之后的A股史上第二只千股。 01 半导体芯片股集体爆发
    的头像 发表于 08-26 13:54 746次阅读
    <b class='flag-5'>寒武纪</b>股价破1200<b class='flag-5'>大关</b>创历史新高 DeepSeek适配国产<b class='flag-5'>芯片</b>成直接原因

    寒武纪85后创始人陈天石身价超1500亿

    在3月份胡润研究院发布的《2025胡润全球富豪榜》上,寒武纪创始人陈天石以870亿人民币身家位列第195位。现在在资本的追逐下,寒武纪85后创始人陈天石身价超1500亿。 近日,在英
    的头像 发表于 08-26 10:37 6122次阅读

    商汤大装置算力Mall重磅发布

    近日,商汤科技联合华为、库帕、海光、寒武纪、曦望Sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”。
    的头像 发表于 08-05 10:05 803次阅读

    寒武纪联手阶跃星辰成立模芯生态创新联盟

    近日,阶跃星辰发布了新一代基础大模型Step 3。Step 3兼顾智能与效率,通过模型和系统联合创新,实现了行业前列的推理解码效率,将于7月31日面向全球企业和开发者开源。目前,寒武纪已初步实现对Step 3的支持。
    的头像 发表于 07-31 11:26 948次阅读

    寒武纪基于思370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 4041次阅读
    <b class='flag-5'>寒武纪</b>基于思<b class='flag-5'>元</b>370<b class='flag-5'>芯片</b>的MLU370-X8 智能加速卡产品手册详解

    寒武纪370芯片参数特性详解

    寒武纪首次采用chiplet技术将2颗AI计算芯粒封装为一颗AI芯片,通过不同芯粒组合规格多样化的产品,为用户提供适用不同场景的高性价比AI芯片
    的头像 发表于 04-24 17:49 4203次阅读
    <b class='flag-5'>寒武纪</b><b class='flag-5'>思</b><b class='flag-5'>元</b>370<b class='flag-5'>芯片</b>参数特性详解

    寒武纪一季度营收大涨4230% 净利润3.55亿 扭亏为盈

    4月18日晚间,国产AI芯片龙头寒武纪发布了财务报告,包括有2025年第一季度财务报告和2024年年度财务报告。 在2025年第一季度,寒武纪营收达到11.11亿,同比增长高达4230
    的头像 发表于 04-19 14:15 1565次阅读

    寒武纪增资全资子公司上海寒武纪

    近日,寒武纪科技公司发布公告,宣布了一项重要的增资计划。为了保障募投项目的顺利实施,并满足全资子公司上海寒武纪的实际运营需求,寒武纪决定使用募集资金1500万
    的头像 发表于 02-05 13:44 1503次阅读

    寒武纪发布2024年度业绩预告

    昨日晚间,国内领先的智能芯片设计企业寒武纪发布了其2024年度的业绩预告。据公告显示,公司预计全年营业收入将在10.7亿至12亿之间,与
    的头像 发表于 01-15 10:30 1242次阅读