0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何优化AI SoC及其上面运行的软件

半导体芯科技SiSC 来源:半导体芯科技SiSC 作者:半导体芯科技SiS 2022-06-15 14:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能机器学习应用数据处理的强劲需求下,大规模并行计算迅速兴起,导致芯片复杂性呈现爆炸式增长。这种复杂性体现在 Cerebras 晶圆级引擎等设计中,该设计是一种平铺多核、多晶片设计,将晶体管数量增加至数万亿个,拥有近百万个计算内核。

人工智能 (AI) SoC 的市场持续增长,竞争也日趋激烈。半导体公司根据性能、成本和灵活性,来找到自己的定位,并不断自我优化,从而导致了新型多核架构的爆发式增长。系统架构师正在尝试不同的方法,希望可以将这种复杂性转化为竞争优势。

在所有复杂性来源中,有一个在多核 AI SoC 中非常重要的来源:即当有多个线程在共享数据上并行运行时,会出现功能错误和性能降低问题。过去,设计人员可以使用经典的 CPU 运行控制来调试问题,但这种方法对多核架构并无效果。导致软件问题的根本原因错综复杂,包括往返时延、内核数量、控制和数据并行、多层层次结构和互相依赖的进程,设计人员从中找出真正根源的机会渺茫。

另外,设计人员还需要考虑软硬件协同优化,这需要大量的功能分析。为了在 SoC 上部署 AI 应用,设计人员必须编译源代码,以充分利用多核架构。这通常需要充分了解 SoC 架构的定制工具链。这个过程包括一个硬件和软件优化及测试周期,从 SOC 仿真开始,一直贯穿至第一次投片和后续器件迭代。

通过这一功能分析周期,团队能够了解以下内容:

· 数据共享的效率;

· 片上网络 (NoC) 是否超载或不平衡;

· 如何在不影响代码执行的情况下评估应用性能;

· 如何优化内存控制器配置文件以提升数据处理能力;

· 如何关联整个 SoC 中的事件;

要做到这一点,我们需要一种全新的方法来优化 AI SoC 及其上面运行的软件。要将高质量的 AI SoC 及时推向市场并在完成部署后保持性能,必须要进行系统范围的功能分析。系统范围功能分析的部分功能包括:

· 深入洞察子系统或组件 ;

· 对整个系统从启动开始的准确、连贯的全景图;

· 事物感知(Transaction-aware) 的互连监控和统计信息;

· 传统的处理器运行控制和追踪;

· 支持所有常见的指令集和互连协议;

· 提供选择或更改重要子系统的灵活性;

· 用于产生数据可见性的灵活强大的工具;

用于监控和分析 IP 的片上基础架构和软件提供了所有这些功能,覆盖范围可从仿真到部署。下图即显示了 SoC 功能监控和分析的典型架构。

接下来的图中展示的示例是一个多核芯片配备片上网络 (NoC) 监视器,可跟踪所有 NoC 事务到循环缓冲器。由于 NoC 监视器具有事务感知功能,可将其配置为检测特定总线条件,例如导致事务持续时间超过特定阈值(按周期数计算)的死锁。当超过阈值时,NoC 监视器可以输出死锁事务以及之前事务的详细信息,以便对问题进行诊断。

同一个 NoC 监视器也可配置为在检测到相同死锁条件时——例如通过跟踪硬件加速器行为的状态监视器模块——使用嵌入式分析消息基础设施的交叉触发功能,在系统中的其他位置触发跟踪。

了解实施有效的系统验证和优化环境时涉及的问题,是成功交付多核 SoC 的关键,与该领域内的专业供应商合作可实现事半功倍的效果。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • soc
    soc
    +关注

    关注

    40

    文章

    4623

    浏览量

    230165
  • AI
    AI
    +关注

    关注

    91

    文章

    41082

    浏览量

    302576
  • 人工智能
    +关注

    关注

    1820

    文章

    50318

    浏览量

    266897
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何使用AI优化PCBA热源分布?

    通过AI技术优化PCBA板上的热源(各类元器件,如芯片、电阻、电容等)分布,核心目标是精准控制PCBA的最高温度,同时降低热应力(避免因温度梯度、热膨胀不均导致的焊点开裂、PCB变形等问题)。这是
    的头像 发表于 04-01 09:20 142次阅读
    如何使用<b class='flag-5'>AI</b><b class='flag-5'>优化</b>PCBA热源分布?

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    310P芯片的底层架构,深度剖析这款产品的技术细节、算力门槛及其在实际产业落地中的真实价值。 一、176TOPS的产业门槛:为何这是边缘算力的新起点? AI硬件的核心指标始终是算力,但不同层级的算力决定
    发表于 03-10 14:19

    Danalto Cardina框架成功集成Qorvo UWB SoC及SDK

    定位智能软件领域的先驱企业Danalto近日宣布,其Cardinal云定位引擎(CLE)已成功集成Qorvo最新推出的超宽带(UWB)系统级芯片(SoC及其面向工业与企业应用的软件
    的头像 发表于 03-03 09:44 442次阅读

    浅谈工业AI的定义和实际应用

    工业 AI 是将物理 AI 及其AI 技术应用于工业流程优化,通过实时工业数据和预测性分析,实现更高水平的自动化和更优决策。
    的头像 发表于 02-05 11:16 817次阅读

    使用NORDIC AI的好处

    <5 KB),可在任何 Nordic SoC/SiP 的主 CPU 上运行,适合加速度计、IMU、PPG、温度、电流等时序传感器数据的 AI 任务。[Nordic Edge AI
    发表于 01-31 23:16

    嵌入式软件单元测试中AI自动化与人工检查的协同机制研究:基于专业工具的实证分析

    ‌ ‌摘要****‌ 本文系统探讨嵌入式软件相较于通用软件在单元测试层面的特殊性,分析其对高覆盖率、可追溯性与实时性验证的严苛需求,并以专业工具winAMS为技术载体,深入研究AI驱动的自动化测试在
    发表于 12-31 11:22

    瑞芯微SOC智能视觉AI处理器

    。B2版本通常在功耗、稳定性和部分外围接口支持上有所优化。NPU: 集成0.8 TOPS的NPU,支持INT8/INT16混合运算,能满足大多数边缘侧的轻量级AI推理需求(如分类、检测、识别)。多媒体
    发表于 12-19 13:44

    融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件

    *附件:ai study.zip*附件:融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件.pdf 基于开源鸿蒙编写的
    发表于 11-12 15:38

    2025年AI 智能终端和SoC芯片解读

    电子发烧友网站提供《2025年AI 智能终端和SoC芯片解读.pptx》资料免费下载
    发表于 09-15 16:38 623次下载

    使用Altera SoC FPGA提升AI信道估计效率

    开销急剧扩大,导致上行带宽的利用率出现瓶颈。   为应对这一挑战,Altera 正依托 Agilex SoC FPGA,提供由 AI 驱动的 CSI 压缩解决方案。结合 Altera 的 FPGA
    的头像 发表于 08-26 16:27 3769次阅读

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    个高度优化、快速而准确的ML 模型,你所需要的只是一个数据集。Neuton 模型可以在任何Nordic SoC运行、Neuton 模型可以在任何Nordic SoC(如我们的旗舰产
    发表于 07-31 11:38

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度
    发表于 07-09 18:30

    Nordic收购 Neuton.AI 关于产品技术的分析

    与 Nordic 的 nRF54 系列超低功耗无线 SoC 结合,使得即使是资源极为有限的设备也能高效运行边缘 AI。Nordic 目前正在将 Neuton 深度集成到自身开发生态中,未来会提供更多工具、固件
    发表于 06-28 14:18

    AI SoC #BK7258 AI能力和技术参数深度解读

    BK7258芯片AI能力深度解读 BK7258是博通集成推出的一款高集成度Wi-Fi 6+蓝牙5.4低功耗音视频SoC芯片,其AI能力通过硬件加速、算法优化及生态整合实现,覆盖边缘计算
    的头像 发表于 06-20 09:44 7507次阅读
    <b class='flag-5'>AI</b> <b class='flag-5'>SoC</b> #BK7258 <b class='flag-5'>AI</b>能力和技术参数深度解读

    RISC-V架构下AI融合算力及其软件栈实践

    面对未来大模型(LLM)、AIGC等智能化浪潮的挑战,进迭时空在RISC-V方向全面布局,通过精心设计的RISC-VDSA架构以及软硬一体的优化策略,将全力为未来打造高效且易用的AI算力解决方案
    的头像 发表于 06-06 17:04 1613次阅读
    RISC-V架构下<b class='flag-5'>AI</b>融合算力<b class='flag-5'>及其</b><b class='flag-5'>软件</b>栈实践