0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

千核RISC-V处理器,通往AI之路的完全体

E4Life 来源:电子发烧友原创 作者:Leland 2021-07-20 09:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谈到如何设计AI加速器,许多工程师都会给出不同的答案,但归根结底仍是在一颗先进制程的芯片上排列组合数十亿个晶体管。然而当前超大规模的AI推理依然面临着不少挑战,比如成本和复杂度高居不下,传统架构下的性能、功耗和可编程性无法满足超大规模的要求等。初创公司Esperanto作为去年才开始冒头的初创企业,却打算用RISC-V来解决这一问题。

Esperanto创立于2014年,其董事长Dave Ditzel曾在英特尔负责下一代微处理器架构的设计。Esperanto的工作方向是基于RISC-V这一开放架构,开发高性能、高效率的计算方案。为此,他们打造了ET-SoC-1,一个千核的RISC-V处理器,也是他们开发的首个AI加速器。

ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是传统的SoC,而是面向超大规模数据中心的“片上超级电脑”。它包含了近乎1100个RISC-V核心,近240亿晶体管。需要指出的是,ET-SoC-1是一个AI推理加速器,并不是训练加速器。

据CEO Art Swift介绍,该芯片采用了台积电7nm制程,在特定的工作任务上,能耗效率提高可至100倍。ET-SoC-1在其他关键工作任务上,性能提升要远高于传统的CPUGPU方案。比如在模拟测试中,用于推荐网络时,其性能提升高达50倍,在图像分类上,性能提升高达30倍。虽然这些暂时只是纸面测试参数,但这样的性能和功耗无疑可以给AI客户带来很大的吸引力。

据了解,这一芯片直至2021年第二季度才正式流片,预计2022年早期才会开始量产。这是因为Esperanto花了很多时间在验证上,作为一家初创公司,Esperanto采用了架构、硬件和软件联合设计的方式,这样一来虽然节省了时间,却也让规格一直在持续变动。因此Esperanto在验证团队上投入了许多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求减少查错和除错时间。

ET-SoC-1芯片架构 / Esperanto

ET-SoC-1用到了两种Esperanto自研的RISC-V核心,分别是4个ET-Maxion(超标量乱序核)和1089个ET-Minion(顺序多线程核心)。ET-Maxion是一颗可以运行Linux的大核心,核心频率超过2GHz,作为ET-SoC-1的控制CPU,而ET-Minion则用于矩阵乘法等重度机器学习数据处理。

ET-Maxion作为核心频率超过2GHz的10级流水线RISC-V核心,其实原本是伯克利大学Boom V2开源核心的的分支,但Esperanto对此进行了大刀阔斧的改进。在SPEC2006测试下,其性能已经超过了Cortex-A57,不过还是次于Cortex-A72以及SiFive最近公布的P550。

虽然是一个小核,但ET-Minion也是一个64位RISC-V核心。ET-SoC-1内,32个ET-Minion和4MB的L2 SRAM组成了“Minion Shire”,一共34个Shire采用Mesh的方式连接在一起,多出来的一个ET-Minion则用作服务处理器。Esperanto用这一千多个ET-Minion做到了强大的浮点性能,某些传统加速器仅支持INT8运算,而ET-SoC-1在FP16或FP32上都能展现出不俗的优势。


搭载6个ET-SoC-1的Glacier Point v2 / Esperanto

Art Swift提到,Facebook推出的开源AI板卡Glacier Point v2可以搭载6个ET-SoC-1芯片,这样以来就可以直接接入已有的开源计算项目(OCP)设备中。这一张卡上就包含了6558个RISC-V核心和192GB的LPDDR4X DRAM,带宽可达822GB/s的同时还拥有较低的功耗。据估计,这一设计的板卡峰值性能可达800 TOPS(INT8)以上。

在软件层面上,Esperanto也为C++、Pytorch和TensorFlow常见的机器学习框架提供了支持。只需采用Facebook的开源编译器,就可以在多个ET-SoC-1芯片上运行机器学习模型。

结语

RISC-V虽然在传统的CPU与GPU市场还未彻底崛起,但在AI加速上,已经以其独到的优势迅速攻城略地。这种千核式的设计其实已经应用于Arm等架构,不少数据中心、超算却依然在尝试用RISC-V作为加速器。

RISC-V凭借其开放性、扩展性和自主性,并没有像Arm那样由低至高地发展市场,而是低端和高端两头抓,一旦消费市场也开始普及RISC-V生态,那时的RISC-V就有与Arm全市场争霸的希望了。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42117

    浏览量

    303122
  • RISC-V
    +关注

    关注

    49

    文章

    2991

    浏览量

    53732
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直播预告|玄铁 x Canonical:从本地推理到 AI 工厂,基于 RISC-VAI 基础设施创新路径探讨

    大模型浪潮下,AI 算力正向“本地推理”与“AI 工厂”两极延伸,而传统架构在低延迟与规模化之间往往顾此失彼。RISC-V 的可定制特性,提供了一条新路径——端侧精简高效,云侧通过众
    发表于 05-15 12:15

    新思科技ImperasDV解决方案让RISC-V处理器验证效率翻倍

    由于 RISC-V 是一个开放性的 ISA,它允许任何开发者自由设计和扩展定制处理器。基于 RISC-V处理器必须保持与不断增长的支持工具和软件生态系统的兼容性。
    的头像 发表于 03-25 13:56 464次阅读

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    OrangePi RV2是香橙派推出的一款基于RISC-V架构的AI开发板,搭载KY X1八处理器。该板以“CPU 融合AI”为核心理念,
    发表于 03-03 20:19

    新思科技VC Formal解决方案在RISC-V验证中的应用

    ——地球上人均 6 颗。从“RISC-V 将无处不在”到“RISC-V,就现在”,RISC-V 已几乎覆盖所有应用。当前,RISC-V 已成功跻身世界主流
    的头像 发表于 02-24 16:38 905次阅读

    Banana Pi BPI-CM6 计算模块将 8 RISC-V 处理器带入 CM4 外形尺寸

    更高性能或 AI 功能的用户来说,BPI-CM6 也非常容易上手。BPI-CM6 拥有 100 kWh 的 RISC-V处理器、200 kWh 的
    发表于 12-20 09:01

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式与 AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 在嵌入式、AI
    发表于 12-18 12:01

    探索RISC-V在机器人领域的潜力

    的硬件配置给人留下了深刻的第一印象: • 核心处理器: 搭载了进迭时空的K1系列高性能RISC-V处理器,具备强大的通用计算能力和AI加速特性。 • 内存与存储: 板载LPDDR4
    发表于 12-03 14:40

    突破!深圳诺奖实验室发布量产级RISC-V处理器IP

    11月14日到16日,在第27届中国国际高新技术成果交易会(简称“高交会”)上,来自图灵奖得主大卫·帕特森教授团队建立的RISC-V国际开源实验室(RIOS)正式发布其高性能开源RISC-V处理器IP
    的头像 发表于 11-19 07:03 9390次阅读
    突破!深圳诺奖实验室发布量产级<b class='flag-5'>RISC-V</b><b class='flag-5'>处理器</b>IP

    基于E203 RISC-V的音频信号处理系统 -协处理器的乘累加过程

    处理器简介 RISC-V具有很高的可扩展性,既预留出了指令编码空间,也提供了预定义的Custom指令;RISC-V的标准指令集仅使用了少部分指令编码空间,更多的指令编码空间被预留给用户进行扩展
    发表于 10-28 06:18

    国产!全志T113-i 双Cortex-A7@1.2GHz 工业开发板—ARM + DSP、RISC-V间通信开发案例

    本文档主要介绍T113-i处理器的ARM + DSP、RISC-V间通信开发案例,演示T113-i处理器ARM Cortex-A7与HiFi4 DSP核心、玄铁C906
    的头像 发表于 08-18 14:03 1245次阅读
    国产!全志T113-i 双<b class='flag-5'>核</b>Cortex-A7@1.2GHz 工业开发板—ARM + DSP、<b class='flag-5'>RISC-V</b><b class='flag-5'>核</b>间通信开发案例

    明晚开播 |开源芯片系列讲座第28期:高性能RISC-V处理器芯片

    鹭岛论坛开源芯片系列讲座第28期「高性能RISC-V处理器芯片」明晚(30日)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目高性能RISC-V处理器芯片报告简介
    的头像 发表于 07-29 17:02 1616次阅读
    明晚开播 |开源芯片系列讲座第28期:高性能<b class='flag-5'>RISC-V</b>微<b class='flag-5'>处理器</b>芯片

    RISC-V如何盈利?本土企业率先破局

    了全行业对RISC-V美好未来的信心。 RISC-V崛起:芯片产业高质量发展的必由之路 当前,全球两大处理器架构中,x86完全封闭,Arm需
    的头像 发表于 07-18 11:32 3678次阅读
    <b class='flag-5'>RISC-V</b>如何盈利?本土企业率先破局

    直播预约 |开源芯片系列讲座第28期:高性能RISC-V处理器芯片

    鹭岛论坛开源芯片系列讲座第28期「高性能RISC-V处理器芯片」7月30日(周三)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目高性能RISC-V处理器芯片报告
    的头像 发表于 07-14 17:34 1553次阅读
    直播预约 |开源芯片系列讲座第28期:高性能<b class='flag-5'>RISC-V</b>微<b class='flag-5'>处理器</b>芯片

    RISC-V和ARM有何区别?

    在微处理器架构领域,ARM与RISC-V是两个备受关注的体系。ZLG致远电子在推出ARM核心版后,又推出了基于RISC-V的MR6450核心版,这引发了人们对这两种架构差异的深入探讨。ARM
    的头像 发表于 06-24 11:38 2392次阅读
    <b class='flag-5'>RISC-V</b>和ARM有何区别?

    HPM5E31IGN单核 32 位 RISC-V 处理器

    HPM5E31IGN单核 32 位 RISC-V 处理器在当今嵌入式系统领域,RISC-V架构正以开源、灵活和高性价比的优势快速崛起。HPM5E31IGN作为先楫半导体的一款单核32位RISC
    发表于 05-29 09:23