0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为啥软件成了人工智能加速器致胜的法宝?

pmkA_arm_china 来源:YXQ 2019-03-27 08:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着Arm生态系统的发展壮大,各种各样的应用场景层出不穷。为了更好地在特定场景下得到更好的性能,能耗比等指标,针对特定应用场景的加速器市场也在蓬勃发展,近年来火热的人工智能加速器(Artificial Intelligence Accelerator)就是一个典型例子。

一个高效的加速器,需要精心设计的硬件以及与之搭配的软件,两者缺一不可,否则用户体验会大打折扣,这也是为什么我们常常看到某些指标非常惊艳的加速器,在实际使用中体验却不尽如人意的原因。以人工智能加速器为例,其中基本的硬件加速单元就是乘加器的组合,但如何让这些乘加器高效地进行并行计算,涉及到上层数据的打包、调度,需要大量的驱动软件工作,而且大部分软件开发者都是基于某种框架进行应用开发,具体见图 1,所以驱动到框架的适配也很重要,甚至有一些框架不能满足应用的需求,需要专门开辟通道进行优化。

图1:ArmNPU软硬件框架

开发一款高性能加速器,需要投入大量人力物力,如果不能大规模使用,那么投入回报比会大大降低,甚至亏本。如果加速器能和不同Arm系统轻松组合,拓展Arm系统的应用范围,那么应用场景将会大大增加,生命周期也会延长。让加速器适配不同的Arm系统,这对软硬件接口和驱动提出了非常大的挑战,因为今天的Arm产品非常丰富,从低功耗的微处理器,主流的移动平台,到高端的服务器,高性能计算处理器都有相应产品。对于一个加速器团队来说,针对尽可能多的Arm配置组合进行开发验证成本将非常高昂,这里面不单单涉及IP/EDA的采购,还有系统的搭建维护,但如果没有这些IP又无法将整个业务流程完整验证,甚至影响软硬件接口的设计优化。

有没有方法高效地解决加速器配套驱动,框架,应用软件开发的问题呢?Fast Model!

图2:使用DS-5调试运行在Fast Model中的系统软件

在Fast Model的例子系统中,Arm给出了一系列Arm核,相关IP组合的子系统模型,以及相应OS,开发工具DS-5,方便客户快速搭建软件开发平台,调整软硬件接口,进行驱动以及上层软件的开发,具体参考图3。

整个开发流程如下:

1.在Fast Model的例子系统中找到你需要的平台,和对应的Bootloader, Firmware,OS软件,并将他们顺利运行

2. 将Fast Model的子系统导出生成SystemC的模型子系统模块

3. 编写加速器的功能模型,通过AMBA PV总线和Fast Model导出的子系统模块进行连接

4. 编写驱动在目标OS中操作加速器

5. 在模型平台上进行软件框架,应用匹配移植

Arm提供了绝大部分市面可见设计的类似子系统,无论是基于Arm v7/v8单核,多核,多cluster系统,还是包含最新架构特性的CPU系统,加速器开发团队都可以在Fast Model的例子程序里面找对类似子系统范例进行适配,在设计之初就可以解决不同系统的适配性问题。Fast Model也提供工具让开发者对例子系统进行修改,生成新的子系统以满足需要。在加速器设计之初,软件硬件人员就可以一起利用丰富多样的例子系统进行架构的探索,对稳定软硬件接口非常有帮助,而稳定的接口定义对长期的产品演进至关重要。

图3:基于Fast Model的加速器软件开发

至此开发者已经完成了大部软硬件接口,驱动以及框架软件开发工作,但驱动中的时序问题还没有完全解决,因为Fast Model是一款功能型模型,它为了提高运行速度(50-200MHz),牺牲了时序信息。对于时序信息,开发者可以最后去仿真平台甚至最终芯片上去调节,而此时软件测试用例和框架都已经完成,这将大大节省占用仿真平台(MHz)进行调试排错的时间,从而降低成本。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 软件
    +关注

    关注

    69

    文章

    5357

    浏览量

    91876
  • 人工智能
    +关注

    关注

    1820

    文章

    50317

    浏览量

    266896

原文标题:为何软件是人工智能加速器致胜的秘密?

文章出处:【微信号:arm_china,微信公众号:Arm芯闻】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak AI),也称限制领域
    的头像 发表于 02-22 08:24 341次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    奇异摩尔参编人工智能加速器互联芯粒技术要求团体标准发布

    近日,中国电子工业标准化技术协会批准并发布了《人工智能超节点服务技术要求》等28项团体标准。其中由中国移动研究院牵头、奇异摩尔产品市场&研发部门主要参编的《人工智能加速器互联芯粒技术
    的头像 发表于 01-09 11:20 782次阅读
    奇异摩尔参编<b class='flag-5'>人工智能</b><b class='flag-5'>加速器</b>互联芯粒技术要求团体标准发布

    工业级-专业液晶图形显示加速器RA8889ML3N简介+显示方案选型参考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 编辑 专业液晶图形显示加速器能够有效减少对MCU运算资源的占用,对于只需普通单片机运算资源的仪器仪表来说,专业图形显示加速器
    发表于 11-14 16:03

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 991次阅读
    边缘计算中的AI<b class='flag-5'>加速器</b>类型与应用

    创客总部加入MathWorks加速器计划

    全球领先的数学计算软件开发商 MathWorks 日前宣布,创客总部已加入 MathWorks 加速器计划。作为中关村科创孵化,创客总部致力于为人工智能创业企业、高校院所技术精英搭建
    的头像 发表于 08-22 10:00 1341次阅读

    润和软件成为南京人工智能生态街区首批联盟成员

    近日,“AI·镜界——南京人工智能生态街区”发布活动在南京市雨花台区盛大举办,旨在打造AI与软件产业深度融合先行区、垂类应用创新示范区和数智跃迁新引擎。作为面向行业的专业数智科技服务商,江苏润和软件
    的头像 发表于 08-07 17:58 2034次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    关于人工智能处理的11个误解

    本文转自:TechSugar编译自ElectronicDesign人工智能浪潮已然席卷全球,将人工智能加速器和处理整合到各类应用中也变得愈发普遍。然而,围绕它们是什么、如何运作、能如
    的头像 发表于 08-07 13:21 1240次阅读
    关于<b class='flag-5'>人工智能</b>处理<b class='flag-5'>器</b>的11个误解

    Microchip推出Adaptec® SmartRAID 4300 系列加速器 提供安全的可扩展 NVMe® RAID 存储解决方案

    ,专为NVMe部署而设计。该系列加速器尤其适用于现代人工智能数据中心环境。在此类环境中,加速访问NVMe存储对于支持高强度工作负载
    的头像 发表于 08-06 16:31 1.9w次阅读
    Microchip推出Adaptec® SmartRAID 4300 系列<b class='flag-5'>加速器</b> 提供安全的可扩展 NVMe® RAID 存储解决方案

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 4065次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    Analog Devices / Maxim Integrated MAX78002人工智能微控制数据手册

    Analog Devices MAX78002人工智能微控制是支持神经网络的AI微控制。Analog Devices MAX78002可在超低功耗下执行,并可在物联网边缘实时工作。该器件将高能效
    的头像 发表于 06-18 15:19 975次阅读

    爱立信携手超微加速边缘人工智能部署

    爱立信与超微 Supermicro近日宣布有意开展战略合作,加速边缘人工智能部署。
    的头像 发表于 06-17 09:42 1.6w次阅读

    MAX78002带有低功耗卷积神经网络加速器人工智能微控制技术手册

    人工智能(AI)需要超强的计算能力,而Maxim则大大降低了AI计算所需的功耗。MAX78002是一款新型的AI微控制,使神经网络能够在互联网边缘端以超低功耗运行,将高能效的AI处理与经过验证
    的头像 发表于 05-08 10:16 1019次阅读
    MAX78002带有低功耗卷积神经网络<b class='flag-5'>加速器</b>的<b class='flag-5'>人工智能</b>微控制<b class='flag-5'>器</b>技术手册