还未设置个性签名
成为VIP会员 享9项特权: 开通会员

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

Think Silicon和RISC-V GPU即将爆发

电子发烧友网 来源:电子发烧友网 作者:电子发烧友网 2022-07-05 10:30 次阅读

电子发烧友网报道(文/吴子鹏)近日,在德国纽伦堡举行的 Embedded World 2022 大会上,致力于为全球半导体技术客户开发用于超低功耗和面积受限的数字设备的高性能图形、显示控制器和机器学习IP技术公司Think Silicon正式对外展示业界首款基于RISC-V的GPU。该公司 IP 许可、销售和营销总监 Ulli Mueller 表示,“推出首款基于 RISC-V 的 GPU 是图形行业和 ThinkSilicon 的一个重要里程碑。”

无论是业界动态还是RISC-V国际组织相关人员的公开发言,RISC-V都是一款全方位挑战ARM架构的新型处理器架构,在ARM架构擅长的CPU、NPU、MCU和系统IP领域,我们都看到了RISC-V架构的身影,而现在业界首款基于RISC-V的GPU已经被展示,产业来到爆发的前夜。

Think Silicon和RISC-V GPU

在RISC-V GPU领域,Think Silicon是最早的一批入局者。2019年12月,Think Silicon便宣布,推出了业界首款基于RISC-V ISA的3D GPU NEOX | V。

介绍资料显示,NEOX是一种基于 RISC-V RV64C ISA 指令集和自适应 NoC 的并行多核和多线程 GPU 架构,内核数量分为4核、16核和64核。

5274cea4-fbef-11ec-ba43-dac502259ad0.png

图源:Think Silicon官网

通过上图能够看出,NEOX系列GPU的主频是一样的,都是800MHz,算力和线程总数会因为核心数量的不同而有所差异,其中64核产品能够提供204.8 GFLOPS的FP32计算吞吐,409.6 GFLOPS的FP16,线程总数为4096。Think Silicon指出,多线程降低了外部内存控制器的延迟,让整个阵列保持高数据吞吐量。

根据Think Silicon新闻稿的介绍,NEOX系列GPU还支持可选的 FP64 和 SIMD 指令。

NEOX IP具有自定义用户指令的各种配置可能性,使其能够灵活地配置关键应用程序,例如计算机图形、机器学习、视觉/视频处理和通用计算等,适用的应用领域包括GPGPU、人工智能、视觉处理、视频处理和计算机图形学等。

528d42ae-fbef-11ec-ba43-dac502259ad0.png

图源:Think Silicon

通过上图的方案架构能够看出,NEOX系列GPU提供AI定制的ISA扩展,可变长度数据类型的 SIMD 矢量,统一着色器架构,以及专用硬件模块等,为实现产品差异化和创建定制独特设计提供强大的支持。

Think Silicon并非独行

综合目前市场消息来看,Think Silicon并非是RISC-V GPU赛道上的孤勇者,无论是芯片大厂,还是初创企业,均有意向这个领域靠拢。

在传统芯片大厂方面,包括英伟达三星英特尔高通和Imagination等都在探索RISC-V,虽然目前动作可能还是在GPU周边,但是以这些厂商的产品布局来看,走上RISC-V GPU赛道是迟早的事情。

比如三星,早在2019年该公司就推出了多款基于RISC-V架构的芯片,并在该年度硅谷举行的RISC-V峰会上展示了采用RISC-V架构来设计5G毫米波射频芯片。三星当时就表示,将采用RISC-V架构来设计公司即将推出的各类芯片,而GPU是三星的产品之一,虽然目前还没有发布,但三星绝对是RISC-V GPU的一份子。

而英伟达则已经将RISC-V应用到GPU控制器部分,未来难免不会以RISC-V作为GPU的内核。同时,此前就有研究人员在名为 Vortex的RISC-V GPGPU 项目上启用 CUDA 软件支持的消息,据悉硬件核心为 RV32IMF ISA,配置为1核到32核。

对于英特尔,很多人都知道英特尔投资了28亿元建立了研究实验室,在做RISC-V处理器方面的研究,而GPU作为重要的协作器件,英特尔定然不会放弃这方面的研究。

而高通和Imagination虽然也还没有推出RISC-V GPU,但前者已经将RISC-V应用到移动处理器里,后者则是已经推出了GPU+RISC-V,因此两家公司也是RISC-V GPU的潜力股。

除了这些传统的芯片巨头,电子发烧友网曾公开报道过VeriGPU,这是一个开源RISC-V项目,作者是来自人工智能呼叫中心自动化公司ASAPP的一名研究工程师Hugh Perkins。VeriGPU专门面向机器学习,并计划让其支持PyTorch深度学习框架。

而在2021年,美国的Pixilica还曾与RV64X合作,提出了一套新的图形指令集,旨在融合CPU-GPU ISA。RV64X是可扩展的架构,用户定义的基于SRAM的微代码可用于实现扩展,例如自定义光栅化器阶段、光线跟踪、机器视觉和机器学习。RV64X可以实现RISC-V CPU+RISC-V GPU的单核设计,也可以打造具有高度扩展性的RISC-V CPU+多核RISC-V GPU设计。

写在最后

正如上文所述,目前各大有GPU产品的厂商都在钻研RISC-V,而Think Silicon的动态无疑将会加速产业进程,让一众厂商在RISC-V GPU上加大创新力量。所谓星星之火可以燎原,Think Silicon已经把RISC-V GPU的火烧起来了,产业大爆发是可以预见的。

原文标题:RISC-V GPU离产业爆发仅一步之遥?

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:彭静
  • gpu
    gpu
    +关注

    关注

    27

    文章

    2858

    浏览量

    116949
  • 应用程序
    +关注

    关注

    24

    文章

    2321

    浏览量

    53645
  • RISC-V
    +关注

    关注

    26

    文章

    761

    浏览量

    37377
收藏 人收藏

    评论

    相关推荐

    AMD下代三大GPU核心渲染图公布

      最近,AMD下一代三个GPU内核的一组渲染图已经发布,但该区域的大小与之前的描述不同。
    的头像 星星科技指导员 发表于 08-18 16:19 87次 阅读

    Canonical宣布成功在昉·星光单板计算机上运行Ubuntu操作系统

    8月18日,作为Ubuntu官方版本的发行方及商业运营公司,Canonical宣布已成功在昉·星光单....
    的头像 StarFive 发表于 08-18 14:33 105次 阅读

    芯来科技打造基于RISC-V的创新发展新方向

    此次融资前,芯来科技不断推动RISC-V CPU IP的国产化应用落地进程,全系列产品已经成熟稳定地....
    的头像 芯来科技 发表于 08-18 09:48 116次 阅读

    零售应用程序中社交距离的存在检测

    存在多种存在检测解决方案,包括占用密度指示和绝对社交距离测量,用于在复杂性和成本范围内的零售空间中进....
    的头像 任凭风吹 发表于 08-17 16:21 85次 阅读
    零售应用程序中社交距离的存在检测

    Ventana:一家做RISC-V服务器芯片的公司

    按照他们的规划,计算和 IO 芯片将由Ventana设计,定制加速芯片将由客户提供,而整个产品由 V....
    的头像 倩倩 发表于 08-17 15:48 133次 阅读

    蓝海大脑高性能深度学习GPU服务器助力生命科学发展

    生命科学 | 药物研发 | 冷冻电镜  靶点发现 | 序列比对 | 晶体预测 随着高性能计算、数据挖....
    的头像 GPU视觉识别 发表于 08-17 14:51 250次 阅读
    蓝海大脑高性能深度学习GPU服务器助力生命科学发展

    介绍HBM3标准的一些关键功能

    HBM2E标准的每个裸片的最大容量为2GB,每个堆栈可以放置12层裸片,从而可实现24GB的最大容量....
    的头像 电子发烧友网 发表于 08-17 14:20 53次 阅读

    log.Fatal和panic函数的区别在哪

    调用函数假装也收到了 panic 函数,从而他们也会执行以上的操作。递归执行,直到最上层函数,如果都....
    的头像 冬至配饺子 发表于 08-17 11:01 253次 阅读
    log.Fatal和panic函数的区别在哪

    使用NVIDIA CloudXR加快AECO工作流程

    数字化转型已扩展到建筑、工程、施工和运营行业(AECO)。最新的先进技术正在帮助 AECO 专业人员....
    的头像 NVIDIA英伟达 发表于 08-17 10:26 229次 阅读

    NVIDIA Omniverse实现多应用工作流程中的实时协作

    介绍使用 NVIDIA Omniverse 3D 模拟和协作平台推动艺术创作或设计流程的个人创作者和....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-17 10:24 153次 阅读

    借助NVIDIA V100 GPU加速AI医学影像学研究

    锘崴科技是一家专业的隐私计算技术服务提供商,公司以锘崴信隐私保护计算平台为核心,开发了一整套自主、安....
    的头像 NVIDIA英伟达 发表于 08-17 10:19 459次 阅读

    科创板的一束“海光”,正在让中国半导体发展之路更清晰

    很少有科技领域,能够像半导体一样,在小至纳米级的方寸天地中,容纳来自全球和全民的期待与注视。提到半导....
    的头像 脑极体 发表于 08-17 09:11 353次 阅读
    科创板的一束“海光”,正在让中国半导体发展之路更清晰

    拿下全球半导体“BIG10”中的八家,这家RISC-V企业有何不同?

    电子发烧友网报道(文/吴子鹏)近日,Cambrian-AI Research LLC创始人兼首席分析....
    的头像 Felix分析 发表于 08-17 08:00 479次 阅读
    拿下全球半导体“BIG10”中的八家,这家RISC-V企业有何不同?

    【议程全览】2022第二届RISC-V中国峰会议程公布(8/24-8/26)

    在RISC-V国际基金会的支持和指导下,第二届 RISC-V中国峰会( RISC-V Summit China 2022)将于2022年8月24日至...
    发表于 08-16 20:38 1381次 阅读

    Domo以与众不同的方式进行数据集成

    Domo是唯一一个结合了数据集成、实时和预测分析可视化数据、构建自身应用程序的云本机平台。
    的头像 广州虹科电子科技有限公司 发表于 08-16 10:48 47次 阅读

    8点PyTorch提速技巧总结

    CPU的话尽量看主频比较高的,缓存比较大的,核心数也是比较重要的参数。显卡尽可能选现存比较大的,这样....
    发表于 08-16 09:50 65次 阅读

    RISC-V设计的基本安全协处理器

      为了保护 IoT 应用程序,PUFsecurity 利用芯片指纹技术来强化信任根,并开发了 PU....
    发表于 08-16 09:31 67次 阅读
    RISC-V设计的基本安全协处理器

    顶级FPGA和GPU的PK

    首先,文章使用GPU最擅长处理的工作负载:通用矩阵乘(GEMM)来跑GPU的benchmark(什么....
    发表于 08-16 09:22 51次 阅读

    模型有助于实现最大的运营效率

      为了推动行动或结果,非结构化数据通过 DeepStream 等处理模型运行,从而产生结构化数据。....
    的头像 星星科技指导员 发表于 08-16 09:16 44次 阅读

    HPC系统的电源控制器,RISC-V也来插一脚?

    电子发烧友网报道(文/周凯扬)对于近几年推出的HPC系统来说,高能效已经成了大家无法规避的话题,就连....
    的头像 E4Life 发表于 08-16 08:00 457次 阅读
    HPC系统的电源控制器,RISC-V也来插一脚?

    使用加速WEKA加速机器学习模型

    最后,我们使用了 HIGGS 数据集 ,其中包含有关原子加速器运动学特性的数据。希格斯数据集的前 5....
    的头像 星星科技指导员 发表于 08-15 17:27 170次 阅读
    使用加速WEKA加速机器学习模型

    简化嵌入式物联网应用程序的软件开发

      一些应用程序在开发中需要更大的灵活性来自定义设置。需要时,可以使用手动编码覆盖 GUI 工具所做....
    的头像 星星科技指导员 发表于 08-15 17:22 125次 阅读
    简化嵌入式物联网应用程序的软件开发

    为NVIDIA MLPerf Training v2.0性能提供动力的全堆栈优化

      NVIDIA MLPerf v2.0 提交基于经验证的 A100 Tensor Core GPU....
    的头像 星星科技指导员 发表于 08-15 16:43 122次 阅读
    为NVIDIA MLPerf Training v2.0性能提供动力的全堆栈优化

    通过GPU内存访问调整提高应用程序性能

    在本文的所有代码示例中,大写变量都是编译时常量。 BLOCKDIMX 采用预定义变量 blockDi....
    的头像 星星科技指导员 发表于 08-15 16:24 108次 阅读

    如何在基于Arm的设备上运行游戏AI呢

    在本系列的第 2 部分中,我们展示了游戏 AI 代理是如何设计的。我们还展示了为 Dr Arm 的 Boss Battle 演示生成的神经网络...
    发表于 08-15 15:43 740次 阅读

    了解SOK的原理

      以上就是 SOK 将数据并行转化为模型并行再转回数据并行的过程,这整个流程都被封装在了 SOK ....
    的头像 星星科技指导员 发表于 08-15 15:22 48次 阅读
    了解SOK的原理

    MicrosoftWPF功能丰富的图表控件

    通过47 个示例应用程序探索GoXam 的可能性。我们创建了许多常见的图表类型作为您的应用程序的起点....
    的头像 lhl545545 发表于 08-15 15:12 55次 阅读

    关于RISC-V的二三事

    基于RISC-V指令集规范,既可以由开源社区来开发开源免费版的处理器实现(如Berkeley开发的R....
    发表于 08-15 14:24 212次 阅读

    将RISC-V放入您的设计中

      一个重要的问题是 RISC-V 是否可以“足够开放”以类似于 Linux 模型的方式运行。如果你....
    的头像 星星科技指导员 发表于 08-15 11:06 236次 阅读
    将RISC-V放入您的设计中

    开源RISC-V架构改变物联网处理器的游戏规则

      我们选择的 RISC-V 内核达到了 20Kgates 的规模,以可观的 2.44 Corema....
    发表于 08-15 10:50 48次 阅读

    MCM应用于GPU还需要多久

    消费用户市场,普通用户都能用上16核甚至64核处理器的PC。这可不是单纯堆核心就完事儿的。以当前CP....
    的头像 FPGA之家 发表于 08-14 14:50 132次 阅读

    国产MCU沁恒微CH32V307开发板试用体验

    自设计之初,RISC-V指令集架构就具备简洁高效、开源开放的特性。
    发表于 08-14 11:41 111次 阅读

    NVIDIA发布NeuralVDB 可将内存占用量减少高达100倍

    NeuralVDB 可将烟雾、云和其他稀疏体积数据的内存占用量减少多达 100 倍。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:58 271次 阅读

    量子处理单元(QPU)的定义及工作原理

    量子处理单元(QPU)是量子计算机的“大脑”。它利用电子或光子等粒子的行为来进行特定类型的计算,其速....
    发表于 08-14 10:33 57次 阅读

    摩尔定律为处理器创新让路

    从数据中心到网络边缘传感器,摩尔定律、冯诺依曼和哈佛在人工智能和图像处理的信号处理新方法方面排名第二
    发表于 08-12 16:04 27次 阅读
    摩尔定律为处理器创新让路

    AI GPU计算在工厂车间提供数据中心性能

    用于自动检测的 AI GPU 计算改变了质量控制操作、运行复杂的视觉算法并整合了工作负载。
    发表于 08-12 16:01 17次 阅读

    壁仞科技发布首款通用GPU芯片 苹果智能指环专利曝光

    近日,亚马逊宣布将以约17亿美元的价格收购真空吸尘器制造商iRobot。根据公告,亚马逊表示,将以每....
    的头像 Camsense 发表于 08-12 13:50 197次 阅读

    RISC-V 随着 Linux 就绪 SBC 的推出而成为现实

    董事会以 999 美元的价格进入拥挤的舞台
    发表于 08-12 12:02 20次 阅读
    RISC-V 随着 Linux 就绪 SBC 的推出而成为现实

    芯动科技风华2号GPU与麒麟操作系统完成互认证

    近期,由芯动科技(INNOSILICON)自主研发的“风华2号”GPU与银河麒麟桌面操作系统全面完成....
    的头像 芯动科技Innosilicon 发表于 08-12 11:37 191次 阅读

    NVIDIA Studio技术如何加速创意工作流

    编辑注:本文是 NVIDIA Studio 创意加速系列的一部分,该系列旨在介绍一些特邀艺术家、提供....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:21 174次 阅读

    NVIDIA Instant NeRF赢得SIGGRAPH最佳论文

    世界各地的开发者和创作者下载了来自 NVIDIA Research 的最新代码,以使用 2D 图像创....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:10 188次 阅读

    IP平台支持云连接设备开发

      越来越广泛的高度便携应用平台,如 Linux、Android 和复杂的实时操作系统 (RTOS)....
    的头像 星星科技指导员 发表于 08-12 10:27 49次 阅读

    使用AI技术改进医学成像

      RDMA 的一个典型用例是超声波。在大多数情况下,超声波利用 FPGA 等前端设备在数据到达 G....
    的头像 星星科技指导员 发表于 08-11 16:37 493次 阅读

    GPU引擎增强了超声检测到的大脑运动计算

      平均而言,GPU 计算位移的时间为 51.50 毫秒,而 CPU 计算的时间为 621.5 毫秒....
    的头像 星星科技指导员 发表于 08-11 15:00 146次 阅读
    GPU引擎增强了超声检测到的大脑运动计算

    在高度时间敏感的低功耗蓝牙应用中使用 RTOS

    当您设计嵌入式系统时,您需要回答的问题之一是您的应用程序是否需要实时操作系统 (RTOS)。许多嵌入....
    的头像 名士流 发表于 08-11 14:33 131次 阅读
    在高度时间敏感的低功耗蓝牙应用中使用 RTOS

    生成软件物料清单

    在您接受来自第三方的应用程序之前,首先使用NexusAuditor对其进行扫描,以清楚地查看是否存在....
    的头像 city_prolove 发表于 08-11 09:35 50次 阅读

    NVIDIA Jetson TX2 NX GPU助力微链DaoAI加速数据处理

    微链 DaoAI是市场领先的3D 视觉和 AI 机器人系统供应商,拥有全球领先的 3D 视觉认知技术....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-11 09:31 157次 阅读

    NVIDIA发布Omniverse重要版本

    NVIDIA 新发布的工具和功能包括:Avatar Cloud Engine;DeepSearch ....
    的头像 NVIDIA英伟达 发表于 08-11 09:29 119次 阅读

    模块化小型机瞄准新兴工业物联网应用

    解决物联网应用程序的困难之一是及早了解应用程序需求,以便在最需要的时候提供解决方案。
    发表于 08-10 17:48 64次 阅读

    国家机器人技术认证为学生提供技术就业途径

    与Nocti Business Solutions共同开发的四项国家级认证项目包括两级发那科认证机器....
    发表于 08-10 16:24 108次 阅读

    FPGA执行通信密集型任务优势 FPGA部署方式特点及限制

    FPGA可针对数据包步骤数量搭建同等数量流水线(流水线并行结构),数据包经多个流水线处理后可即时输出....
    发表于 08-10 10:19 257次 阅读

    RISC-V在汽车产业的发展机遇

    从产业发展格局来看,RISC-V在汽车产业确实有巨大的发展机遇,其开源和模块化特性如果加以合理引导,....
    的头像 电子发烧友网 发表于 08-10 09:11 141次 阅读

    每日推荐 | Tina V85x 平台E907启动方式,OpenHarmony征文活动获奖名单

    大家好,以下为电子发烧友推荐每日好帖,欢迎留言点评讨论~ 1、全志V853芯片 在Tina下RISC-V核E907启动方式的选择 推荐...
    发表于 08-08 10:14 6233次 阅读

    全志V853芯片 在Tina下RISC-V核E907启动方式的选择

    V853开发板购买链接:https://www.hqchip.com/p/KFB-V853.html 1.主题 Tina V85x E907启动方式选择 2.问题背景 Tin...
    发表于 08-05 15:03 9260次 阅读

    [每日一芯]感芯科技 MC3172 系列 64线程并行 32位risc-v MUC 附完整资料

    MC3172 是一款多线程实时处理器,其特点为64线程同步并行运行,互不阻塞,各个线程共享数据段与代码段,无通信瓶颈。100%单周...
    发表于 08-05 13:53 6561次 阅读

    每周精选 | Pegasus Wi-Fi IoT智能家居套件开发样例,天启教育M1开发板快速上手指南

    大家好,电子发烧友精选一周社区好帖推送给大家,同时欢迎大家留言推荐更多好帖子,一旦入选将获得电子发烧友月度vip奖励! 1、...
    发表于 08-05 10:40 10413次 阅读

    基于RISC-V内核自带的一个64位定时器(MTIMER)编写程序

    本 demo 基于 risc-v 内核自带的一个 64 位定时器(MTIMER)编写。本 demo 可以为后面 os tick 提供参考。 硬件连接 无 ...
    发表于 08-04 15:50 2188次 阅读

    远景研讨会 纪要,面向下一代计算的开源芯片与敏捷开发方法

    远景研讨会(SIGARCH Visioning Workshop)纪要 面向下一代计算的开源芯片与敏捷开发方法 作者:包云岗 2019 年8 月...
    发表于 08-04 15:38 1708次 阅读

    怎么使用ARM处理器上的GPU进行编程工作呢

    怎么使用ARM处理器上的GPU进行编程工作呢?有哪位大神可以解释一下 ...
    发表于 08-04 14:17 1825次 阅读

    【中科亿海微EQ6HL45开发平台试用体验】Tiny RISC-V 在中科亿海微EQ6HL45 FPGA 平台移植实践(2)-RAM IP的使用

    Tiny RISC-V移植中的问题 前面提到tiny Risc-V里面的ROM/RAM是用LUT构成的,好处是代码在不同的平台可以通用,...
    发表于 08-02 20:07 262次 阅读