0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知乎用户曝光的寒武纪下一代云端AI芯片——思元270(MLU270)

DPVg_AI_era 来源:lq 2019-05-07 09:11 次阅读

近日,知乎网友提出一个劲爆问题——如何看待寒武纪新一代人工智能芯片规格?问题一出便引发热议,疑似寒武纪下一代产品“思元270”提前被曝光,有望在低精度训练领域实现重大突破,性能或超越NVIDIA最新一代芯片!

AI芯片领域又有大爆料!

近日,知乎突然出现了一个劲爆提问 “如何看待寒武纪新一代人工智能芯片(疑似思元/MLU270)规格?”,提问者以匿名方式贴出了疑似寒武纪下一代云端AI芯片MLU270的相关信息,包括芯片外观以及某些具体参数

知乎链接:

https://www.zhihu.com/question/322886889

知乎用户曝光的寒武纪下一代云端AI芯片——思元270(MLU270)

根据问题和回答记录中显示,似乎已有多家厂商接触到了相关资料,经他人在网上披露信息后,寒武纪下一代芯片规格被提前曝光。

智能芯片领域,寒武纪被称为这一行业的先行者,“先行者”的行踪被泄露,自然会吸引众多从业者的关注与讨论——“新一代的云端AI芯片规格到底如何?”。该提问在短时间内就受到了知乎网友的广泛关注,阅读次数迅速过万。

独家爆料:“思元”年初悄然注册,数据遭泄,性能或超越NVIDIA最新一代芯片

据泄露照片显示,寒武纪的新一代云端AI芯片MLU270已于今年年初研制成功,主要包括如下五点特性:

基于台积电16nm工艺打造。

架构代号从上一代的MLUv01升级到了MLUv02。

内建视频解码单元(似乎是专门为视频处理市场配置)。

但按照寒武纪一直把MLU系列芯片定位为通用智能芯片来看,MLU270应该能够继续支持语音和自然语言处理等重要AI任务。

峰值方面,这颗芯片提供int4 256Tops, int8 128Tops的惊人性能,功耗为75w,与全球AI芯片龙头NVIDIA的最新一代Tesla T4基本持平。

在围绕新品的讨论中,这款新品是否与国际业内巨头NVIDIA持平也是知乎网友热议的一点。

大多数网友的看法都是持积极态度。虽然NVIDIA在国际范围内颇有“一家独大”的态势,但卓越的学术成就以及融资优势仍让很多网友看好寒武纪:对于前途大好的AI芯片市场,玩家越多,越有意思——“有新的竞争者加入进来对业内每一家都是好事”。

但也有网友认为超越NVIDIA绝非易事,峰值高低并不能直接决定市场上的胜负,如何接近核心客户可能是寒武纪需要跨过的更高门槛,也是能否与NVIDIA等巨头一决胜负的关键。

另外,业内反馈Tesla T4在75w功耗条件下实测性能距离理论峰值有较大差距,不知寒武纪能否突破这一瓶颈,未来尚需相关用户公布实测结果。

寒武纪思元270芯片内部分技术参数

值得注意的是,照片中出现的”思元”这个名字,很可能是寒武纪云端芯片品牌

MLU(Machine learning unit)的中文名。笔者顺藤摸瓜,查了一下国家商标局的网站(http://sbj.saic.gov.cn/sbcx/),发现寒武纪已经在年初注册了“思元”商标。

国家商标局网站,寒武纪注册“思元”信息

有网友在网站回答题主时反馈,“MLU”这个名词有些拗口,平时和同事交流时容易和“MCU”混淆。新的“思元”品牌,貌似可以解决这个小问题,也有利于打开市场知名度。

知乎匿名用户评论

来自同行的疑惑:“思元270”专注AI推断任务还是兼做训练任务?

耐人寻味的另一点是,照片中只包括了整数性能的数据,也没有交代是这颗芯片是专注人工智能的推断任务还是兼做训练任务,令一些同行感到疑惑。

查阅寒武纪以往公开信息,发现寒武纪不存在任何一款代号是MLU270的芯片产品。寒武纪的上一代产品MLU100已经公布,是专注于推理的AI芯片,而且发布时间尚不满一年,不太可能是同一产品线自相残杀式的迭代,更有可能是专注于训练的新产品。

寒武纪上一代芯片——MLU100

照片中仅公布了低精度整数性能,存在两种可能性:

一是表格中有意遗漏了浮点数据;

二是寒武纪在低精度训练领域实现了关键性突破。

而新智元从业内传闻看更倾向于第二种可能性。

实际上,低精度训练的需求在业界由来已久。算法工程师使用GPU做训练,通常使用其浮点运算单元,主要是因为在有监督学习的BP算法中,只有精确的浮点运算才能记录训练时很小的增量。而浮点运算单元占用的芯片面积和功耗相比于整数运算器都要大很多倍,导致单位芯片面积的处理能力要差很多。

目前业界在人工智能的推断类应用上,发现整数运算可以不影响模型的精度,因此用于推断的芯片已经大量集成了整数运算器或低精度浮点运算器。但业界一直在尝试是否有机会用代价更低的整数运算器实现更为复杂的训练功能,这样可以在不增加芯片面积和功耗的前提下,大幅提升芯片做训练的运算能力。但这个问题在业界也还没有普适的解决方案。

如果寒武纪真的在低精度训练领域实现了突破,那将会是AI芯片领域的重大消息。新智元在发稿前尝试联系寒武纪确认该技术信息,但目前尚未有回复。

思元270系列板卡实物照片

据了解,寒武纪在过去三年一直保持每年一代的产品迭代速度。在终端领域:

2016年推出寒武纪1A处理器IP;

2017年推出双核的寒武纪1H;

2018年推出寒武纪1M。

迄今已经服务于数千万台终端设备。

寒武纪CEO陈天石曾表示,寒武纪的云端智能芯片产品,迭代速度会和终端产品一样快。从这一次的消息泄露来看也确实如此,从去年初的MLU100到今年的MLU270。能够以一年一代的速度进行研发的,国内也仅有华为海思一家在消费类手机芯片能做到。

在发稿前,新智元专门回顾了寒武纪去年发布会的新闻,发现陈天石博士在去年曾提到一款名为“MLU200”的云端芯片。这次泄露的MLU270芯片已经研制成功,但是否就是去年发布会时陈天石提到的MLU200,抑或是寒武纪还另有名为MLU200的产品?

无论如何,大型AI芯片能在一年时间迭代一代确实令人意外,但如果寒武纪能够同时研发多款高复杂度的芯片,这可能意味着寒武纪已经具备非常完备的芯片研发能力,在迈向AI芯片新巨头的道路上又前进了一步。

我们今天如何造芯?回望寒武纪三年AI修行之路

那么,寒武纪在智能芯片这条路上到底是如何发展的呢?新智元对此做了一下梳理:

2016年发布的寒武纪1A处理器(Cambricon-1A),是世界首款商用深度学习专用处理器。

2017年8月,寒武纪科技一亿美元的A轮融资消息传出,在A轮融资后估值达到10亿美元,成为全球AI芯片领域第一个独角兽初创公司。

2016年发布的寒武纪1A处理器(Cambricon-1A)

2017年11月,寒武纪召开自成立以来的首场发布会,公布了系列新品及公司未来路线图——“3年内占领10亿智能AI终端,占领中国云端高性能芯片1/3市场份额”。发布会上,寒武纪三款全新的智能处理器IP产品亮相:面向低功耗场景视觉应用的寒武纪1H8、拥有更广泛通用性和更高性能的寒武纪1H16,以及面向智能驾驶领域的寒武纪1M。

2017年11月寒武纪首场发布会

2018年5月,寒武纪发布第三代IP产品Cambricon 1M,以及最新一代云端AI芯片MLU100和板卡产品。其中,MLU100采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。

2018年5月发布的寒武纪MLU100

2018年6月,寒武纪宣布完成数亿美元的B轮融资,投后整体估值达25亿美元,继续领跑全球智能芯片创业公司。

按照寒武纪惯例,今年上半年应该会有一次发布会。在这次发布会上是否能够顺利地看到此次遭泄露的“思元270”,又是否真如曝光数据所示,峰值高达256Tops,亦或像网友猜测的那样,在低精度训练领域中实现了关键性突破?值得期待。

那么根据此次曝光的资料,你更倾向于哪种猜测呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 寒武纪
    +关注

    关注

    11

    文章

    182

    浏览量

    73724
  • AI芯片
    +关注

    关注

    17

    文章

    1641

    浏览量

    34355
  • 自然语言处理

    关注

    1

    文章

    507

    浏览量

    13096
收藏 人收藏

    评论

    相关推荐

    AI芯片第一股”寒武纪发布2023年度业绩快报 亏8.36亿元!

    AI芯片第一股”寒武纪(688256)在2024年2月28日发布2023年度业绩快报。
    的头像 发表于 03-04 13:41 342次阅读
    “<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>第一股”<b class='flag-5'>寒武纪</b>发布2023年度业绩快报 亏8.36亿元!

    寒武纪与智象未来联手,推动视觉大模型的技术创新与应用

    在大模型领域,寒武纪自底层硬件架构至基础软件更新,皆针对大模型的实际应用场景进行了细致优化。依托高效的推理引擎MagicMind,寒武纪思元(MLU)系列云端智能加速卡支持输入输出变换
    的头像 发表于 01-24 09:59 276次阅读

    寒武纪与智象未来达成战略合作并完成大模型适配

    1月22日,寒武纪与智象未来 (HiDream.ai) 在北京签订战略合作协议,双方将通过资源共享、优势互补,依托各自在大模型领域的技术积累,持续产品适配,携手推动视觉大模型的创新与落地。
    的头像 发表于 01-23 13:46 276次阅读
    <b class='flag-5'>寒武纪</b>与智象未来达成战略合作并完成大模型适配

    寒武纪的思元(MLU云端智能加速卡与百川智能完成大模型适配,携手创新生成式AI

    近日,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,寒武纪思元(
    的头像 发表于 11-06 20:32 858次阅读
    <b class='flag-5'>寒武纪</b>的思元(<b class='flag-5'>MLU</b>)<b class='flag-5'>云端</b>智能加速卡与百川智能完成大模型适配,携手创新生成式<b class='flag-5'>AI</b>

    基于PXA270的多媒体终端设计

    电子发烧友网站提供《基于PXA270的多媒体终端设计.pdf》资料免费下载
    发表于 10-26 14:40 0次下载
    基于PXA<b class='flag-5'>270</b>的多媒体终端设计

    寒武纪回应美国AI芯片出口管制新规:正进一步解读和分析

    公司产品大模型的要求事项是否能满足对寒武纪公司产品基本硬件架构的指令集合设计从后续软件进行升级时,大规模的重复模式,即自然语言处理应用程序,人工智能应用场景进行优化和设计的。”
    的头像 发表于 10-19 10:27 506次阅读

    国内外AI芯片、算力、大模型综合对比(2023)

    国内AI芯片厂商格局:一梯队,有成熟产品、批量出货的企业,包括寒武纪、华为海思、百度昆仑芯、燧原科技等;二梯队,以AI芯片起家的壁 仞科技、
    的头像 发表于 09-28 16:01 5986次阅读

    寒武纪董事长陈天石再次承诺:不以任何方式减持公司股份

    事实上,陈天石也在不久前承诺过不会减少持有股份。2023年7月28日,寒武纪发表《首次公开发行部分限售股上市流通公告》。寒武纪董事长陈天石、艾溪合伙及全体董事会董事承诺不减分。
    的头像 发表于 09-27 09:56 523次阅读
    <b class='flag-5'>寒武纪</b>董事长陈天石再次承诺:不以任何方式减持公司股份

    持续亏损、裁员,创投股东减持套现!“AI芯片第一股”寒武纪前路漫漫

    万股股份,占目前公司总股本的1.25%。   公告称,国投创业基金本次减持计划时间区间届满,本次减持计划已实施完毕。本次累计减持739.87万股,套现14.81亿元,减持后,国投创业基金持有寒武纪股份数量仅剩1176股,基本完成清仓。   今年上半年AI概念疯狂
    的头像 发表于 09-26 09:03 1721次阅读

    玉龙810芯片寒武纪芯片对比

    玉龙810芯片寒武纪芯片对比 随着人工智能技术的不断发展,芯片作为AI发展的重要基础,成为了各大企业竞相研发的焦点。而在这些
    的头像 发表于 08-17 11:09 2768次阅读

    8N3S270 数据表

    8N3S270 数据表
    发表于 07-18 18:35 0次下载
    8N3S<b class='flag-5'>270</b> 数据表

    8N4S270 数据表

    8N4S270 数据表
    发表于 07-14 10:59 0次下载
    8N4S<b class='flag-5'>270</b> 数据表

    CPU卡(RTK0EMX270C02000BJ)物料清单

    CPU卡(RTK0EMX270C02000BJ)物料清单
    发表于 07-05 19:23 0次下载
    CPU卡(RTK0EMX<b class='flag-5'>270</b>C02000BJ)物料清单

    1SS270A 数据表

    1SS270A 数据表
    发表于 04-26 20:00 0次下载
    1SS<b class='flag-5'>270</b>A 数据表

    1SS270 数据表

    1SS270 数据表
    发表于 04-26 20:00 0次下载
    1SS<b class='flag-5'>270</b> 数据表