宏观算力建设实现芯片规模化-电子发烧友网

1、算力由性能、规模和利用率三部分组成

算力 = （单芯片）性能 x 规模（即数量） x 利用率。

算力是由性能、规模、利用率三部分共同组成的，相辅相成，缺一不可：

有的算力芯片，可能可以做到性能狂飙，但较少考虑芯片的通用性易用性，然后芯片销量不高落地规模小，那就无法做到宏观算力的真正提升。

有的算力提升方案，重在规模投入，摊大饼有一定作用，但不是解决未来算力需求数量级提升的根本。

有的解决方案，通过各种资源池化和跨不同的边界算力共享，来提升算力利用率，但改变不了目前算力芯片性能瓶颈的本质。

性能、规模、利用率，宏观微观，牵一发而动全身。管中窥豹终有偏，既要考虑多种因素协同设计，更要宏观的统筹算力问题。

2、最核心的，通过超异构实现芯片性能的数量级提升

一方面，超异构可以通过集成更多的加速引擎来实现相比CPU、GPU的性能的数量级提升，但更多的计算是在DSA架构引擎完成的，从单位晶体管资源的性能效率视角看，是和DSA在一个量级的。

工艺进步、3D封装、Chiplet封装等各种创新，支持数量级提升的设计规模。但要想充分利用这些价值，就需要创新的系统架构。超异构计算，通过分布式系统设计，可以驾驭数量级提升的更大的设计规模。因此，可以做到相比传统DSA再继续10倍甚至100倍的性能提升。

3、在超异构的约束下，实现规模化落地

3.1 芯片要更好地支持规模化

从微服务的视角，云计算是由不同的服务组成的分层服务体系：每一层就是一个服务族，然后不同层次的服务族组成整个云计算服务体系，这就是我们所熟悉的云计算三层服务IaaS、PaaS和SaaS。

更详细的软件堆栈如上图所示，从非云系统所有的“服务”堆栈都需要用户自己拥有并维护，经过IaaS、CaaS、PaaS、FaaS，再到最后的SaaS，一切都由供应商运营维护。从左到右的过程，就是“服务”堆栈的下层layer不断地由云运营商接管的过程。

这是一个鲜明的“二八定律”案例：80%的任务由云运营商负责，20%的任务由用户负责；站在用户的角度，20%自己负责的任务价值占到80%，而运营商负责的部分只占到到20%的价值。

因此，基于二八定律，我们可以把整个系统分为三部分：

基础设施层。基础设施层的任务都相对确定，适合DSA和ASIC处理引擎处理。

应用层可加速部分任务。基础设施层是CSP使用，而应用层则是给到用户应用。用户的应用多种多样，因此应用层的加速也需要一定程度的弹性。这样，GPU和FPGA就相对比较合适。

应用层的不可加速部分。主要是一些通用的处理，如控制以及一些细粒度的计算。协处理器是CPU的一部分。因此，CPU适合各类通用任务处理，CPU负责兜底。

如上图所示，整个系统的处理有点像塔防游戏：DSA负责干粗活累活，大量的计算任务在DSA中完成；GPU是性能和灵活性折中一些，负责一些弹性加速的计算任务；CPU啥都能干，但性能较差，因此负责兜底，也就是其他处理引擎都干不了的，都放在CPU。

这样，CPU+GPU+DSA+etc.的超异构计算架构就可以实现“包治百病”的、相对通用的计算架构和平台，就可以实现在云、网、边、端等大算力场景以及用户的绝大部分覆盖。

更多场景和更多用户的覆盖，这样才能真正实现芯片的规模化落地。芯片的大规模落地之后，又进一步摊薄一次性研发成本，进一步降低成本，形成良性循环。

3.2 宏观算力建设实现芯片规模化

要想持续不断地增加算力，不可避免的就是建设更多的数据中心。2022年2月，国家发改委、中央网信办、工业和信息化部、国家能源局联合印发通知，同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点，并规划了10个国家数据中心集群。至此，全国一体化大数据中心体系完成总体布局设计，“东数西算”工程正式全面启动。

“东数西算”通过构建数据中心、云计算、大数据一体化的新型算力网络体系，将东部算力需求有序引导到西部，优化数据中心建设布局，促进东西部协同联动。“东数西算”工程有三个总体思路：一是推动全国数据中心适度集聚、集约发展。通过在全国布局8个算力枢纽，引导大型、超大型数据中心向枢纽内集聚，形成数据中心集群。二是促进数据中心由东向西梯次布局、统筹发展。三是实现“东数西算”循序渐进、快速迭代。

除了大型云数据中心建设之外，也需要更多的边缘数据中心和服务器、更多的超高算力的智慧终端，以及更智慧的网络核心设备，来共同提升宏观总算力。

4、在超异构的约束下，提升算力利用率

4.1 提升算力利用率的手段

云计算出现之前，部署一套互联网系统，一般有两种方式：小规模的时候，自己购买物理的服务器，然后租用运营商的机房；超过一定规模的时候，就需要自己建机房，租用运营商的网络，自己运维数据中心的软件和硬件。这个时候的算力资源是一个个孤岛，整个业务的模式也非常之重，成本很高而且弹性不足。如果算力资源配置比较多，就意味着资源浪费和利用率低；如果算力资源配置比较少，就意味着无法支撑业务的发展，丢失关键的商业机会。

云计算通过互联网按需提供IT资源，并且采用按使用量付费的方式。用户可以根据需要从云服务商那里获得技术服务，例如计算能力、存储和数据库，而无需购买、拥有和维护物理数据中心及服务器。云服务使用多少支付多少，可以帮助用户降低运维成本，用户可以根据业务需求的变化快速调整服务的使用。

其他如基于分布式云的边缘计算、跨不同云厂家的MSP、算力网络以及云网边端融合等，都是尽可能的把算力资源整合成一个巨大的资源池，然后可以灵活的根据各种完全动态变化的需求来提供合适的算力。

我们分析一下，要想提升算力利用率，肯定不能是算力的孤岛：

第一个阶段，所有的设备是孤岛，各自要实现各自的所有功能。软件应用也是单机版，算力利用率很低，应用的规模受单个硬件规格的限制；

第二阶段，有了互联网，不同的设备可以进行协作。可以通过C/S架构实现跨设备的软件应用协作。这样，应用的规模就突破了单个设备的约束。

第三阶段，所有的算力资源形成一个整体。可以自动的、任意的切分算力资源。软件也升级成了MicroService架构。这样可以根据设备的规格大小，运行合适大小合适数量的微服务。只有资源形成巨大的资源池，然后通过各种运营管理，才能真正提高算力的利用率。

4.2 芯片视角看算力利用率

资源池化是提升算力利用率的根本途径，但资源要想池化，对硬件有很高的要求：

不同设备架构/接口一致。比如CPU等引擎架构一致（比如都是x86架构平台），那么软件可以运行在任何一个设备上，硬件也可以支持各种不同的软件运行。比如NVMe SSD，可以被不同的用户访问，也可以同时或分时地支持多种用户的工作。

支持虚拟化。一方面是资源粒度的问题，另一方面是资源自由和动态分配的问题，都可以通过虚拟化技术解决。虚拟化还可以实现不同架构/接口的抽象，屏蔽硬件差异。

通常，算力的平台都是CPU，而且目前x86架构CPU占据了绝大部分市场份额，并且x86 CPU对虚拟化的支持也非常的好。CPU对资源池化的支持，或者说对算力更高利用率的支持，是相当的友好。

但是，随着性能需求越来越高，不得不通过超异构计算来数量级提升算力的时候，问题出现了。在超异构的架构下，如何实现更高的灵活性，如何实现更高的扩展性，如何实现各类资源的轻松便捷地池化和共享，则是一个全新的挑战：

处理引擎要支持虚拟化和高可扩展性；

软件可以跨不同厂家的、不同架构处理引擎；

软件可以跨跨CPU、GPU、DSA等不同类型处理引擎；

软件可以跨云网边端。

5、展望，云网边端大融合

在虚拟化的加持下，软件可以实现完全高可用：软件可以脱离硬件实体，随意的寻找合适的平台运行，自适应的在云、网、边、端运行。

随着CPU的性能瓶颈，I/O虚拟化技术完全硬件化的情况下，硬件接口直接暴露给软件，这就需要云数据中心内部，以及跨云边端的硬件平台一致性。

要想实现跨云网边端、跨不同厂家的芯片平台、跨不同类型不同架构的处理引擎，就需要芯片、系统、框架和库、以及上层应用的多方协同，就需要开源开放的超异构计算生态。

万物互联，当所有的设备算力资源汇集成一个大的共享资源池，算力资源将取之不尽用之不竭。

原文标题：再来聊聊大家都经常聊的算力话题

文章出处：【微信公众号：Imagination Tech】欢迎添加关注！文章转载请注明出处。

审核编辑：彭静

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

处理器

处理器

+关注

关注
68

文章
18328

浏览量
222504
芯片

芯片

+关注

关注
447

文章
47872

浏览量
409899
cpu

cpu

+关注

关注
68

文章
10463

浏览量
206711
算力

算力

+关注

关注
1

文章
665

浏览量
14382

原文标题：再来聊聊大家都经常聊的算力话题

文章出处：【微信号：Imgtec，微信公众号：Imagination Tech】欢迎添加关注！文章转载请注明出处。

声通科技：高标准化及可扩展的产品能力，助力公司实现规模化经营

全栈交互式人工智能解决方案提供商，一直以来都注重产品标准化和可扩展性的建设，不断提升自身的产品能力和市场竞争力。据了解，声通科技为了实现企业级解决方案的快速规模化部署，开发出了一整套Voicecomm Suites，整体从功能

发表于 04-16 15:51 •124次阅读

富唯智能机器人控制系统：实现规模化柔性生产的智能引擎

在当下高度复杂的工业生产环境中，机器人如何实现规模化的柔性生产，已成为业界关注的焦点。特别是在追求高效率、高质量的生产过程中，团队协作的重要性愈发凸显。富唯智能一体化AMR控制系统，作为机器人的核心指挥部，犹如一个强大的大脑，为机器人提供了灵活多变、数字精准、智能高效的指

发表于 03-18 14:44 •112次阅读

富唯智能机器人控制系统：<b class='flag-5'>实现</b><b class='flag-5'>规模化</b>柔性生产的智能引擎

iBeLink KS MAX 10.5T大算力领跑KAS新领域

打造。这种芯片可以在存储和计算之间实现高速的数据交换，从而提高了运算效率和稳定性。iBeLink ks max10.5T还拥有三档可调的性能模式，可以根据不同的局域网难度和电价，选择合适的算力

发表于 02-20 16:11

大茉莉X16-P，5800M大算力称王称霸

算力

Rykj365
发布于 :2024年01月25日 14:54:52

请问AD芯片采集和转换时间怎么算啊？

请问AD芯片采集和转换时间怎么算啊？就是输入到单片机之前，采集完所有通道并完成转换的时间，以AD7994为例，能不能介绍下？

发表于 12-21 07:32

中国信通院汤立波：以融合应用先导区建设，促“5G+工业互联网”规模化发展

先导区建设要体现发展政策、基础设施、行业应用、产业生态、公共服务五个先导。通过加大政策支持力度、夯实基础设施建设、推进融合应用创新、培育壮大产业生态、强化公共服务能力等举措，推动“5G+工业互联网”规模化发展。

发表于 11-25 15:55 •645次阅读

第四代北斗芯片发布

国家北斗创新发展、高质量发展进一步筑牢了底座。在北斗芯片“硬科技”的加持下，北斗将全面赋能千行百业，向着深度应用、大众化应用、规模化发展的方向加速前进。

发表于 09-21 09:52

“用好”北斗，还看芯片

测绘等领域实现广泛应用，为北斗规模化应用提供了坚实的芯片基础。图注：HD8120典型应用行业在实现产品广泛应用的基础上，华大北斗推出了北斗芯片

发表于 09-15 10:14

《2023中国卫星导航与位置服务产业发展白皮书》发布，北斗芯片再受关注

销售。目前，华大北斗“芯片级”高性能、高精度定位解决方案已成功应用于上汽名爵全新MG7轿跑车、上汽荣威SUV“鲸”车型的智能驾驶系统中，这是国产北斗高精度定位芯片规模化应用道路上的重要里程碑之一

发表于 09-11 09:35

华大北斗用“芯”服务地灾监测

低成本、低功耗、高精度的形变监测产品在地灾监测行业的应用，并满足毫米级高精度监测规模化应用要求。芯片级北斗地质灾害监测整体解决方案实时监测-安全监测与预警分析云平台结合其他传感器，地灾监测系统

发表于 08-31 09:15

华大北斗高精度芯片助力上汽名爵MG7智能驾驶

GNSS卫星导航定位芯片级解决方案提供商，提供基于核心芯片的高精度导航定位解决方案，从产业链源头支撑中国北斗高精度规模化应用，服务全球。华大北斗与上汽集团成功合作，将国产自主北斗芯片成

发表于 08-30 14:44

燧原科技开启AIGC应用规模化落地时代

的第一款新产品。燧原曜图面向AIGC，规模化落地时代以燧原科技邃思系列芯片为算力支撑，由首都在线提供计算服务，燧原曜图MaaS（Model-as-a-Service）平台服务产品为用户提供面向AIGC时代的高效易用、安全可靠、企业级的文生图服务。它具备开箱即用可

发表于 07-05 10:09 •538次阅读

中汽创智：面向规模化量产的高阶智能驾驶系统研发与实践

智能驾驶在商业落地的过程当中难免遇到问题，智能驾驶到底什么时候真正落地?日前，在黑芝麻智能主办的“2023智能汽车芯片高峰论坛”上，中汽创智科技有限公司智能驾驶CTO张振林发表“面向规模化量产的高阶智能驾驶系统研发与实践”主题演讲，分享了该公司的一些思考。

发表于 06-07 16:31 •720次阅读

如何实现宏观叠加态？

从较早的单离子运动态薛定谔猫[1]开始，一系列越来越“大”的猫被制备出来。这里“大”有两方面含义，一是指宏观特性的分离尺度大。例如宏观特性为空间位置时（根据量子力学，物体可同时处于不同空间位置），两分支的空间距离大。

发表于 05-24 10:39 •552次阅读

蜂巢能源智造方法论：“规模化+数智化”角力TWh时代竞争

进入规模化制造时代，电池行业的科技属性逐渐回归到制造属性。头部锂电厂商技术趋同趋势下，竞争核心将体现在企业的制造能力上。

发表于 05-08 11:42 •649次阅读

搜索历史

宏观算力建设实现芯片规模化

评论

声通科技：高标准化及可扩展的产品能力，助力公司实现规模化经营

富唯智能机器人控制系统：实现规模化柔性生产的智能引擎

iBeLink KS MAX 10.5T大算力领跑KAS新领域

大茉莉X16-P，5800M大算力称王称霸

请问AD芯片采集和转换时间怎么算啊？

中国信通院汤立波：以融合应用先导区建设，促“5G+工业互联网”规模化发展

第四代北斗芯片发布

“用好”北斗，还看芯片

《2023中国卫星导航与位置服务产业发展白皮书》发布，北斗芯片再受关注

华大北斗用“芯”服务地灾监测

华大北斗高精度芯片助力上汽名爵MG7智能驾驶

燧原科技开启AIGC应用规模化落地时代

中汽创智：面向规模化量产的高阶智能驾驶系统研发与实践

如何实现宏观叠加态？

蜂巢能源智造方法论：“规模化+数智化”角力TWh时代竞争