0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

硬件算力需求飙升,为什么软件生意越来越火?

张慧娟 来源:电子发烧友网 作者:张慧娟 2019-10-14 07:59 次阅读

人工智能进一步推动了对算力的渴求,硬件的世界已经发生了极大的颠覆,不论是数据的处理方式还是计算架构的延伸,除了CPUGPUDSPFPGA等,还涌现出各种各样的AI加速器。除了传统的芯片提供商,算法提供商、设备服务商甚至互联网公司等,也都开始规划自己的芯片战略。另一方面,创新速度也在加剧,甚至远远超出芯片的设计速度。

硬件发展受到了前所未有的挑战。但与此同时,软件的重要性也被提到了前所未有的高度。这背后的逻辑是什么?

三大行业趋势正在驱动变革

第一个趋势是云和端的一体化。以前我们将大的计算量都放在云端,但随之而来产生了带宽传输的问题。当把运算量渐渐移到端侧的时候,又产生了功耗、算力的问题。可能的处理方式是:当数据量较小的时候放在端侧,随着数据量增大再放到云上,这就使得很多场景下很难界定究竟是云上还是端侧,因此需要从云到端统一的解决方案,来适配不同场景下的计算需求。

第二个趋势是AI激增。其前提是数据量的激增,以及数据形态的巨大变化。从传统的文本、图形数据,到现在的视频音频、社交等非结构化数据,未来还有包括联网汽车数据、神经网络数据、基因数据等更多形态的数据。当数据量越来越大之后,如何让数据发挥真正的价值成为重要的关注点。

第三个趋势是异构计算。传统上应对运算性能提升的方式包括单核速度的提升,以及单核变多核。但是当这两种方式仍然无法满足计算需求的时候,CPU+GPU、CPU+FPGA等组合形式的异构计算概念出现了。异构虽然带来了性能上的提升,但是也给软件开发者带来了各种挑战。

软硬件各自为政的时代已过去!

除了上述趋势,软硬件本身的特性也在促使二者关系的转变。硬件按照物理规律在发展,相对于软件,必然存在迭代慢、架构复杂的问题,特别是随着摩尔定律趋缓,硬件架构上的物理增长越来越艰难。相较之下,算法的增长和优化则空间很大,一方面能够提升硬件架构的物理性能;另一方面,通过算法的升级能够带来算力上的跃进。例如苹果、华为、百度、阿里等公司都推出了内置AI算法的芯片,应用场景多以云端为主。

在这些趋势的引领下,软硬件的关系产生了新的变化。软件似乎正变得越来越重要,许多公司甚至选择软件为先,硬件再去跟进。

当所有创新都被按下快进键的过程中,硬件工程师需要工具帮助他们突破固定硬件的开发限制,快速面对市场;软件工程师则需要帮助他们屏蔽硬件复杂性,让他们可以在熟悉的开发环境中提升效率。

二者谁更重要呢?没有软件,芯片无法使用,需要大量的软件开发者去将它表达为用户真正所需;另一方面,软件又需要芯片这个实体去承载,在整个系统中发挥价值。

谁能帮助硬件和软件工程师重新坐下来对话,为他们搭建起沟通的桥梁?

巨头们已经嗅到了这样的趋势。

10月9日,赛灵思宣布推出开放、标准、免费的统一软件平台Vitis。这是赛灵思有史以来首次发布的一款软硬件统一的平台,可以说是赛灵思近年来转型中一个重要的成果,根据官方说明,它可以让包括软件工程师和 AI 科学家在内的广大开发者都能受益于硬件灵活应变的优势。Vitis统一软件平台支持赛灵思异构平台(包括FPGA、SoC和Versal ACAP)上开发嵌入式软件和加速应用,为边缘、云和混合计算应用加速提供统一编程模型。它可以与高层次框架进行集成,通过加速库采用C、C++Python进行开发,也可以使用基于RTL的加速器和低层次运行时API对实现方案进行粒度更为精确的控制。

四层堆栈,打通从硬件到应用的道路!

Vitis 平台构建在基于堆栈的架构之上,该架构可以无缝插入到开源的标准开发系统与构建环境,并且包含一套丰富的标准库。

基础层是 Vitis 目标平台,该平台由电路板和预编程 I/O构成。

第二层称为 Vitis 核心开发套件,覆盖开源赛灵思运行时库,以管理不同域间的数据移动,包括子系统、即将发布的 Versal ACAP内的AI引擎和必要的外部主机。此外,该层也提供编译器、分析器和调试器等核心开发工具,这些工具设计的目的是能与业界标准的构建系统与开发环境无缝集成。

在第三层,8个Vitis 库提供 400 余种优化的开源应用。这8个库分别是:Vitis 基本线性代数子程序(BLAS)库、Vitis 求解器库、Vitis 安全库、Vitis 视觉库、Vitis 数据压缩库、Vitis 计量金融库、Vitis 数据库集和 Vitis AI 库。借助这些库,软件开发者可以使用标准的应用编程接口(API)来实现硬件加速。

Vitis 平台的第四层,也是最具有变革意义的一层是 Vitis AI。它集成了特定领域架构(DSA),提供了针对AI模型的硬件实现,开发者可以使用包括TensorFlow和Caffe等框架进行配置与编程。Vitis AI 提供的工具链能在数分钟内完成优化、量化和编译操作,在赛灵思器件上运行预先训练好的AI模型。此外,它也为从边缘到云端的部署提供了专用 API,实现更好的推断性能与效率。赛灵思很快还将推出另一个 DSA(Vitis Video),支持从 FFmpeg 直接进行编码并提供同样超级简单且功能极强大的端到端视频解决方案。由合作伙伴公司提供的 DSA 包括:与 GATK 集成用于基因分析的Illumina,与ElasticSearch 集成用于大数据分析的BlackLynx,以及当前客户正在使用的专有DSA。

如何打破软硬件壁垒,提升创新效率?

赛灵思软件和人工智能高级经理罗霖,以智慧城市为例说明了如何通过统一软件平台Vitis,来帮助开发人员进行效率提升。

智慧城市一个典型的应用场景就是在道路上实时统计交通流量,包括汽车流量、人流量等,通过大量摄像头实时捕捉,在前端进行特征提取,再传给服务器或云端,进行更高层次的信息提取和分析。

这个典型案例中,摄像头和边缘端服务器端都可以部署赛灵思的器件,硬件开发人员完成IP开发后,再由嵌入式开发人员进行一定程度的修改,基于Shell和Runtime,由应用开发人员使用经过优化的库(包括CNN加速库、数据分析和加速库)完成应用开发。

对于算法开发人员,他们通过TensorFlow等进行模型训练之后,可以得到一个浮点的Model。接下来的开发流程中,他们就可以使用Vitis AI开发工具。基于模型进行第一步优化,第二步完成模型的量化即定点,第三步定点好之后进行编译,生成基于底层DPU的机器代码。最终,在板上进行部署后分析性能,包括运算效率等。如果觉得性能已达到目标,就可以编译成库,应用代码可以直接调用编译好的库,进行网络推断。整个过程中,他们不需要关注底层的RTL、驱动程序或是数据的搬运,所有的工作都是基于模型,由工具去生成在目标硬件上运行的机器代码。

如何快速通过Vitis达到用户所需的目标性能?罗霖表示,第一,软件开发人员可以把算法,包括前后处理都在CPU上完成,这部分不需要底层硬件开发人员的帮助,用Vitis可以达到每秒6帧的性能;第二,把DPU放在Shell里,用算法在其中做加速,性能可以从每秒6帧提升到每秒30帧;第三,为了提升端到端的性能,比如预处理是设计空间的转换或者是视频缩放,这部分可以用Vitis库提供前处理的优化,从30FPS提升到40FPS甚至再提升到80FPS。

整个项目中用到了浏览器、编译器还有分析器,按照时间线来看,内核占用情况、数据从编写到搬运占用时间、中断是否合适……所有这些底层运行的细节,软件工程师一目了然,从而可以判定系统的运行状况,以及瓶颈问题等。而传统上,还需要在工具中专门插入芯片间隙或数据监测器才能够实现。

屏蔽硬件复杂性——当前软件的重要价值

通过开放、通用的软件来屏蔽硬件复杂性,使软件人员在他们熟悉的开发环境中专注于创新,而无需关注底层硬件平台的细节——成为消除当前软硬件壁垒的主要手段。

今年8月,Intel对其即将于年底发布的oneAPI开发者测试版本进行了剧透。OneAPI整合了计算和架构创新,通过高速互连以及新的软件开发模式,希望为开发者简化API。Intel希望将硬件能力抽象出来,把最重要的算法融于oneAPI,使开发者不再需要针对硬件做开发,更容易发挥出硬件的所有潜力。Intel的软件策略似乎更强调围绕架构所进行的扩展,横跨PC、网络和数据中心,目标包括易用性、开放性以及统一的开发体验。

再看英伟达建立在GPU基础上的通用计算开发平台CUDA,由于在性能、成本和开发时间上较传统的CPU解决方案有显著优势,当时一经推出就颇受市场欢迎。近年来,英伟达为了推进GPU的易用性,仍持续从软件层面帮助开发者在更多垂直领域的GPU平台上部署应用程序。

赛灵思大中华区销售副总裁唐晓蕾表示,提供灵活丰富的硬件选择给软件工程师,通过高层的API去调用下层资源,这个理念是一致的,只是不同厂商有不同的实现手段。赛灵思强调软件定义硬件,硬件必须是可适应的、灵活的。

她以自动驾驶多样化的应用场景为例谈到,摄像头、环视、泊车等可能由不同的公司来实现,应用场景包括高速公路、市区、港口、码头等等。如果专门为某一个应用设计一款芯片是不可能的,客户需要的是——灵活的、扩展性较强的平台,可以根据应用和工作负载来优化系统,这是赛灵思推出Vitis的主要原因。此外,推出开放、标准、免费的Vitis,也便于拓展用户群,让更多的软件工程师体验赛灵思的的自适应硬件平台。

未来软硬件的关系走向?

使用标准的环境与API、拥抱开源、软硬件协同作战——是未来软硬件关系的三大方向。

由于开源社区在生态系统和开发者社区创新中越来越重要,巨头们都希望以更积极的态度介入这场大变革之中。

值得一提的是,在开放性方面,赛灵思一个很大的创新还在于:赛灵思完全将集成的开发环境免费提供给用户,让他们将Vitis无缝集成在自己的开发环境中。这与过去用户自己设计开发环境,背后调用赛灵思的编译器和调试工具有很大的不同,更有利于软件开发人员在自适应的开发平台上释放创新力。其开发者网站developer.xilinx.com,将作为连接Vitis开发者社区的空间,由赛灵思、Vitis专家及爱好者共同管理,分享更新、设计技巧等信息。

正如唐晓蕾所说,如果以搭建乐高来比喻未来的系统设计的话,那么硬件更像是一个个的乐高块,软件就像是搭建规则或是创意。乐高块也许会有相同,但不同的搭建方式可以实现创意纷呈,赛灵思希望把乐高块越做越丰富,给工程师更多的选择,帮助他们更容易实现更多的功能创新,灵活应对不断变化的市场需求。



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230596
  • 异构计算
    +关注

    关注

    2

    文章

    93

    浏览量

    16159
收藏 人收藏

    评论

    相关推荐

    cs1237两个差分线,正极端电压大于负极端,两者相差越大,读出来的数据越来越

    尝试加上补码转原码也是一样,压差越来越大,数值越来越小,正常不应该是越来越大吗?
    发表于 03-30 10:52

    嵌入式会越来越卷吗?

    嵌入式会越来越卷吗? 当谈及嵌入式系统时,我们探究的不仅是一种科技,更是一个日益多元与普及的趋势。嵌入式系统,作为一种融入更大系统中的计算机硬件软件,旨在执行特定功能或任务。但这个看似特定的系统
    发表于 03-18 16:41

    IC datasheet为什么越来越薄了?

    刚毕业的时候IC spec动则三四百页甚至一千页,这种设置和使用方法很详尽,但是这几年IC datasheet为什么越来越薄了,还分成了IC功能介绍、code设置、工厂量产等等规格书,很多东西都藏着掖着,想了解个IC什么东西都要发邮件给供应商,大家有知道这事为什么的吗?
    发表于 03-06 13:55

    能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务器的具体规格: 处理器:BM1684X :高达32Tops INT8峰值 内存:16GB L
    发表于 02-28 11:21

    iBeLink KS MAX 10.5T大领跑KAS新领域

    —KHeavyHash。在市场上,有一款挖掘机可以满足这个要求,那就是iBeLink ks max 10.5T。 iBeLink ks max 10.5T是一款专为Kaspa挖掘而设计的挖掘机,它的
    发表于 02-20 16:11

    请问用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量?

    来自一位用户的咨询,麻烦帮忙解答,详细越好,有图有真相,可以适当提供一些英飞凌解决方案和产品推荐。 用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量? 未来电动汽车会使用SOC来代替大量MCU?
    发表于 02-02 07:16

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    绝对值编码器用于定位,单方向旋转,位置偏差越来越大是什么原因?

    绝对值编码器用于定位,单方向旋转,位置偏差越来越大。 编码器用来定位,定位是循环的,不同值对应不同位置例:1-2-3-4-1 不同位置录入不同编码器数值。刚才是运转几圈,位置比较准确, 当单方向运转好多圈之后,位置偏移越来越大,求大家帮忙分析下问题所在!!!!
    发表于 01-09 11:50

    防雷及ESD静电保护器件的发展趋势| 浪拓电子

    近年市场对于防雷及ESD静电保护组件的需求,大致可分为两大发展方向。 一是越来越低的等效电容,这是由于近年各项传输port的加速发展,带动带宽越来越大且速度越来越快,例如USB 3.0
    发表于 01-08 16:55

    FPGA和CPU、GPU有什么区别?为什么越来越重要?

    使得要求愈 发偏向高并行而不是高串行。CPU 越来越难以胜任高的场景,,将需要大规模、高密度的计算任务卸载 到在某一方向做了优化的专
    发表于 11-09 14:09

    单片机在以后会越来越趋向于低端化应用吗?

    随着现在的技术和产品功能需求越来越高,好像单片机能完成的事情越来越少;以后是不是嵌入式芯片是主流,单片机渐渐只能在低端上应用?
    发表于 10-24 08:30

    关于软件硬件的行业现状

    互联网本质上是处理信息数据的行业,它的原材料是信息,产出也是信息。从二十世纪末社会进入信息时代以来,信息相关的需求一路飙升。那么此时,需求便是主要矛盾中的主要方面。
    的头像 发表于 06-25 10:22 488次阅读

    为什么国产在线测径仪越来越受到重视!

    保障上、及时性上等都有着不可比拟的优势。 测径仪还具备智能测控软件系统,通过计算机的人机界面可以看到八个不同方向的尺寸波动情况,及时精确地反映测量轧件的尺寸变化。可以帮助操作人员确定是否需要调整、换辊等
    发表于 06-08 17:36

    为什么进口芯片行业越来越难做???

    从上周开始进口芯片的价格成断崖式掉价,是因为国内生产力度下降了嘛,不是都说5月会慢慢恢复生产嘛
    发表于 05-30 10:29

    倒装芯片,挑战越来越

    正在开发新的凸点(bump)结构以在倒装芯片封装中实现更高的互连密度,但它们复杂、昂贵且越来越难以制造。
    发表于 05-23 12:31 746次阅读
    倒装芯片,挑战<b class='flag-5'>越来越</b>大