0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面对AI终端市场需求,定制AI芯片将成为趋势

独爱72H 来源:雷锋网 作者:雷锋网 2019-11-14 15:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:雷锋网)

随着AI算法的逐步成熟以及芯片算力的提升,历经几年的热潮之后,AI技术只有落地应用才能获得进一步的发展。不过,算法需求与芯片算力不匹配的需求成为了AI落地的一大障碍,AI软硬一体化成为关键。但在软硬一体化提高效率的同时,如何满足多样化的需求也非常关键,定制化成为了趋势。

这一轮AI热潮,不仅让越来越多的人认识和了解了AI技术,AI也正在成为每台智能设备日常工作的一部分。事实证明,深度神经网络(DNN)非常有用,但是AI的进一步发展和落地仍有很多挑战。比如,如何使得现有解决方案跟上发展趋势?如何扩展解决方案?如何以成熟的工具链缩短TTM(Time to Market)和降低成本?

面对这些问题,需要整个产业链的协作,共同满足市场的需求。根据市场研究机构的报告,到2022年,全球具有计算机视觉/机器视觉相继的规模将超过15亿个,包括智能手机、安防、消费电子、汽车图像传感器、工业等。这就意味着,定制化的AI加速器可以更好地满足市场的不同需求,但与此同时,AI在边缘端的落地也面临挑战。CEVA营销副总裁Moshe Sheier认为,在边缘AI中,AI的落地面临的问题就是数据量太大且运算太复杂,芯片的算力非常关键。

Moshe Sheier近日接受雷锋网采访时表示,AI算法公司在做落地项目的时候,受困于硬件算力不足的问题,可能会牺牲很多特性。所以我们现在希望算法公司能够向芯片公司提出更多的需求,让芯片的设计能够更好地满足算法需求。只有算法的效率提高了,AI才能更好的落地。

提到效率,无法避开的问题就是AI到底需要专用还是通用的芯片,通用的芯片能够更好适应算法的演进,但算力不及专用芯片。Moshe Sheier认为,AI加速器一定是一个趋势,同时,视频DSP在AI中非常重要,因为AI算法还有很多不确定性。如今算法公司不会只采用一种神经网络,而是会进行组合。运行多个神经网络模型就一定会涉及对结果进行CV的处理,这时候CPU可能会面临一些瓶颈。我们的XM DSP针对了所有流行的神经网络都进行了优化,能够更好的满足多神经网络的算法。

基于对流行神经网络特征的理解,CEVA在今年9月推出了第二代面向边缘设备的AI推理处理器架构NeuPro-S,NeuPro-S系列包括NPS1000、NPS2000和NPS4000,它们是每个周期分别具有1000、2000和4000个8位MAC的预配置处理器。NPS4000具有最高的单核CNN性能,在1.5GHz时可达到12.5 TOPS,并且可完全扩展,最高可达到100 TOPS。

根据官方的说法,与CEVA第一代AI处理器相比,NeuPro-S的性能平均提升50%,内存带宽和功耗分别降低了40%和30%。这种性能的提升主要来自硬件还是软件的优化?Moshe Sheier表示主要是来自硬件,因为CEVA在NeuPro-S中增加了离线的权重压缩和硬件的权重解压缩。

之所以要这么做,是因为神经网络与视频编解码不太一样,即便很小的图片,引入卷积后权重的数据量非常大,因此带宽成为了AI处理器的瓶颈。而CEVA采用的多重权重压缩,可分为两种方式,一种是零值和非零值,可以用4bit或者8bit表示,另一种是通过查表的方式,通过共用权重,只传一次数据,减少对带宽的需求。

不仅如此,NeuPro-S还支持多级内存系统。具体而言,就是加入了L2内存的支持,用户通过设置L2的大小,可以尽量把数据放在L2的缓存,减少使用外部SDRAM,降低传输成本。Moshe Sheier指出,硬件增加L2并不复杂,CEVA主要的工作是在我们CNDD软件框架中加入对L2内存的支持。

因此,NeuPro-S相比上一代NeuPro非常重要的工作就是进行带宽的优化,这样才有可能达到理论设计的利用率。雷锋网(公众号:雷锋网)了解到,CEVA设计神经网络引擎时最关注的问题就是乘法利用率,CEVA借助DSP设计的丰富经验,设计出的神经网络引擎理论的乘法利用率在80%-90%、虽然实际利用率会低于理论值,但NeuPro-S带宽的增大将能够减少数据的等待,能提高乘法利用率。

最终,经设计优化NeuPro-S,能够对边缘设备中视频和图像中的物品进行分割、检测和分类神经网络,显著提高系统感知性能。除了支持多级内存系统以减少使用外部SDRAM的高成本传输,并支持多重压缩选项和异构可扩展性,提升算力满足AI算法的需求。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53601

    浏览量

    459894
  • AI
    AI
    +关注

    关注

    90

    文章

    38310

    浏览量

    297410
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI终端爆发!模拟芯片企业2024年狂揽市场,最高净利暴增400%

    ,他们均受益于市场需求的增长,特别是在高性能数模混合信号、电源管理、信号链等领域。这些企业不仅在传统业务领域取得了显著增长,还积极布局AI技术,以应对新兴的市场需求和技术挑战。     图:2024年模拟
    的头像 发表于 04-18 00:18 3295次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>终端</b>爆发!模拟<b class='flag-5'>芯片</b>企业2024年狂揽<b class='flag-5'>市场</b>,最高净利暴增400%

    哪些 AI 编程工具能够根据项目需求进行定制?企业级研发场景的能力评估与实践趋势

    特点、技术架构、代码规范而深度适配的 AI 编程工具,正在成为提高研发效率、保障交付质量的关键。 在这一趋势下,企业开始更加关注: 哪些工具不仅能“写代码”,更能“根据项目需求
    的头像 发表于 12-08 16:10 414次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    流体芯片AI计算平台 ⑥基于AI的自主决策系统 ⑦基于AI的自主学习系统 2、面临的挑战 ①需要造就一个跨学科、全面性覆盖的知识库和科学基础模型 ②需要解决信息不准确和认知偏差问题
    发表于 09-17 11:45

    2025年AI 智能终端和SoC芯片解读(下)

    AI智能终端经验分享
    电子发烧友网官方
    发布于 :2025年09月15日 16:49:21

    2025年AI 智能终端和SoC芯片解读(中)

    AI智能终端经验分享
    电子发烧友网官方
    发布于 :2025年09月15日 16:44:48

    2025年AI 智能终端和SoC芯片解读(上)

    AI智能终端经验分享
    电子发烧友网官方
    发布于 :2025年09月15日 16:37:48

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI的发展历程吗?本章作者将为我们打开AI的发展历程以及需求和挑战的面纱。 从2017年开始生成式AI
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    ,其中第一章是概论,主要介绍大模型浪潮下AI芯片需求与挑战。第二章和第三章分别介绍实现深度学习AI芯片的创新方法和架构。以及一些新型的算法
    发表于 09-05 15:10

    AI 芯片浪潮下,职场晋升新契机?

    芯片定制项目,在项目初期,通过对目标应用场景的深入分析,确定了芯片的核心功能与性能指标,这一过程体现了市场洞察与需求分析能力。在研发阶段
    发表于 08-19 08:58

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    基础。 睿海光电在深圳建有3120+平方米智能制造基地与独立研发中心,构建了从设计到交付的全链条能力,支撑其快速响应市场需求。 二、交付速度:比行业快2-3天,赋能客户抢占先机 在AI算力竞赛中,交付效率
    发表于 08-13 19:01

    4450亿美元!Edge AI市场大爆发,英特尔布局哪些AI SoC芯片

    AI是边缘计算和IoT增长的最大驱动力,预计到2030年,AI将成为全球边缘市场的重要驱动力,市场规模有望达到4450亿美元。英特尔在边缘
    的头像 发表于 08-04 08:46 6776次阅读
    4450亿美元!Edge <b class='flag-5'>AI</b><b class='flag-5'>市场</b>大爆发,英特尔布局哪些<b class='flag-5'>AI</b> SoC<b class='flag-5'>芯片</b>?

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    创新、应用创新、系统创新五个部分,接下来一一解读。 算法创新 在深度学习AI芯片的创新上,书中围绕大模型与Transformer算法的算力需求,提出了一系列架构与方法创新,包括存内计算技术、基于开源
    发表于 07-28 13:54

    DeepSeek推动AI算力需求:800G光模块的关键作用

    的100G光模块已无法满足高效能AI训练和推理所需的大规模数据传输。为了应对这一挑战,400G、800G乃至1.6T光模块的出现成为行业必然趋势。特别是随着DeepSeek等模型的规模扩大,如何提升
    发表于 03-25 12:00

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    加速特定任务,如数据预处理、加密和解密等,从而提高整体计算效率。 3.芯片设计与生态的变革• 定制化与灵活性:FPGA的可编程性使其能够根据特定应用需求进行定制化设计,这与
    发表于 03-03 11:21

    行业集结:共同定制 RK3566 集成 AI 眼镜的前沿 AR 方案

    高性能、低功耗和多功能集成等优势,适用于多种智能场景。设简约,佩戴轻巧,AI 眼镜不仅是一款智能设备,更是彰显品味的时尚单品。通过丰富的硬件和软件支持,可以快速实现产品化,满足市场需求。 在技术革新前沿
    发表于 02-20 18:44