0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

支持大语言模型的AIoT系统设计难度在哪?该怎么做设计验证?

芯华章科技 来源:芯华章科技 2023-07-17 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ChatGPT成为今年现象级的热门应用后,一个说法也在行业里悄然流传开——1万枚英伟达A100芯片,是做好大模型训练的入门级装备。一时之间“洛阳纸贵”,AI芯片成为了大家眼中的“屠龙宝刀”。我们看到,大量抓住机遇的人,不仅投身大模型产品,还有一部分负责给“掘金人”卖铲子。

那么问题来了:

支持大语言模型的AIoT系统,

设计难度在哪?

该怎么做设计验证?

藏在“屠龙刀”里面的秘籍究竟是什么?

过去的AIoT,通常指的都是带低算力的端侧小芯片,但是随着类似ChatGPT的大语言模型全面得到应用,在端侧AIoT芯片上部署需要几十到几百TOPS算力的LLM大模型也成为新的需求。但是新一代AIoT芯片要提高十倍到百倍算力,这不仅仅是堆砌算力那么简单,需要从性能、互连、带宽、接口进行全面的系统级规划和设计。

新一代的AIoT芯片已经不是一个独立的芯片个体,目前市场上的AIoT芯片几乎都结合了CPUGPUFPGADSP等核心零部件。这就必然需要支持系统级芯片开发的EDA流程。

实际上,芯片设计厂商也意识到了这个问题。当制程工艺逼近极限,但人们对电子产品性能的追求还在不断攀升时,压力很快就传导到了上游的芯片厂商。借助面向系统级的创新,提升芯片的终极性能表现,也成为大家的共识。

所以没有任何分歧,无论从哪个维度看,大规模的系统级芯片设计由于场景丰富、系统规模不断扩张,这一需求正在快速形成市场主流的大浪,涌向EDA工具并推动其不断革新。

如何做好大系统芯片设计?

2023年7月13日至14日,备受期待的第三届中国集成电路设计创新大会(ICDIA 2023)在无锡召开。作为国内领先的系统级验证EDA解决方案提供商,芯华章受邀参加此次盛会,在“AIoT与ChatGPT”分论坛上针对大系统芯片设计挑战,分享了自己的解决方案。

大系统芯片设计,首先要理解什么叫“系统”?对高性能AIoT、自动驾驶、高性能CPU和GPU等等复杂应用来说,系统意味着多节点互联,每个节点都有自己的控制单元(如CPU)和计算单元(如AI、NPU),每个节点都有自己的操作系统和应用软件。

毫无疑问,大系统是一个软硬件一体化、多节点一体化的复杂平台,但也只有把这整个平台都在芯片流片前验证通过,才能真正保证高性能复杂芯片设计的正确性。

因此,大系统芯片验证,最直接的挑战来自于规模庞大的系统级仿真但困难远不止于此,由“大”带来的结构性挑战,涵盖了从验证到调试的方方面面。而更大的设计本身往往意味着更长的时间、更高昂的成本、更慢的仿真性能,本质上也就意味着更困难的验证。

在当下的技术和市场环境下,大系统芯片设计的验证面临三大共性难题,这些难题正是传统的EDA工具所难以解决的痛点:

设计大,很大,大到放不下

从多核、Chiplet封装、多节点到完整系统,复杂的验证规模可以轻易达到百亿甚至千亿门,对验证工具的容量提出了更高的要求,试想如果验证平台根本无法仿真完整的应用系统,又怎么能证明设计是完整正确的?但供数十亿至数百亿规模容量的验证平台,其性能、规模、可调试性又往往成为难以平衡的选择。

验证慢,很慢,难以收敛的慢

系统级规模不断增大,系统级仿真在整个验证的仿真流程中比例不断增大,导致验证团队特别依赖性能和数量有限的硬件仿真系统,导致验证慢的不仅仅是仿真速度,更是整个验证工作的收敛速度和效率。

Debug难,很难,越往后越难

在如此复杂和大规模的系统级仿真上,调试就变成一个更加困难的问题。仿真平台上观察到的问题,到底来自软件、芯片逻辑设计还是多节点互连?问题能否稳定复现?如何在多种仿真平台的数据之间进行综合分析?不解决这些问题,大系统的调试就会越往后期越难,最终影响整个项目周期。

我们似乎开始找到“屠龙刀里秘籍”的线索。作为最上游的辅助设计工具,EDA创新确实是提升系统级设计效率,降低创新成本的关键“钥匙”。

芯华章资深产品与业务规划总监杨晔表示,“单个IP的验证需求在降低,SoC或单个chiplet级的验证需求在不断上升,因为这部分是客户系统级创新的核心。然而在新场景的应用中,传统的EDA工具在应对大容量、深度调试、多种验证场景混合使用的时候,遇到各种效率挑战。芯华章致力提供从软件、硬件到调试的整体解决方案,特别是在大规模设计的系统级验证、硬件验证、架构验证等方面,将为用户提供全流程大系统芯片验证解决方案。”

b2ea95de-247f-11ee-962d-dac502259ad0.png

芯华章大系统芯片设计验证解决方案的核心,是基于敏捷验证理念,建立统一的EDA数据库,打造从IP到子系统再到系统级的统一测试场景,提早开始系统级验证,实现验证与测试目标的高速收敛,进行高效率、高效益的快速迭代,从而助力芯片及系统公司提高验证效率,降低研发成本。

b2ffae56-247f-11ee-962d-dac502259ad0.png

芯华章针对大规模系统级芯片“量身打造”的敏捷验证方案,已经在多个领域获得具体项目部署。

针对自动驾驶应用芯片,芯华章高性能硬件仿真系统HuaEmu E1不仅有高性能仿真和深度调试,还提供了LPDDR5模型用于客户内存仿真,提供CSIDSI模型用于仿真自动驾驶系统的输入和输出,这些都超出了单颗芯片的范畴,是针对软硬件一体化的系统方案进行仿真验证。

为了解决原型系统和硬件仿真之间切换版本成本高,延长验证周期的问题,芯华章发布的双模硬件验证系统HuaPro P2E则基于统一的软件平台和硬件平台,可以在综合、编译、验证方案构建、用户脚本、调试等阶段,能最大程度的复用技术模块和中间结果,并使用统一用户界面,从而实现原型验证和硬件仿真丝滑的无缝集成,在节约用户成本的同时,还能大大提高验证效率。

传统的软件仿真工具以调试功能强大著名,但却受限于仿真速度,不擅长处理系统级的大规模仿真验证。基于芯华章自主研发的逻辑仿真器GalaxSim,芯华章GalalxSim Turbo实现多核、多服务器并行运算,可以实现1K-10KHz的复杂系统软件仿真,从而可以在RTL阶段提前进行系统级仿真。

拿到屠龙刀并不一定能号令天下,只有学会了刀里面的绝学才能真正成为“武林至尊”。

当“大模型”的路上人越来越多时,产业同样也需要向上游追溯,进一步提升创新效率,在激烈的竞争中快人一步。作为芯片产品定义和创新的核心环节,随着以系统级场景为代表的产业数字化需求迸发,EDA正从方法学、从底层架构开始这场自我革新。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    559

    文章

    8214

    浏览量

    363974
  • FPGA
    +关注

    关注

    1655

    文章

    22283

    浏览量

    630285
  • EDA工具
    +关注

    关注

    5

    文章

    275

    浏览量

    33802
  • AIoT芯片
    +关注

    关注

    0

    文章

    34

    浏览量

    4253
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10074

原文标题:支持大语言模型的下一代AIoT系统该怎么做设计验证?

文章出处:【微信号:X-EPIC,微信公众号:芯华章科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的本地部署。
    的头像 发表于 10-29 16:59 1016次阅读

    AI模型的配置AI模型怎么做

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    NVMe高速传输之摆脱XDMA设计25: NVMe 子系统模型设计

    本课题提出 NVMe子系统模型的设计理念, 并将其整合到验证平台中, 使 NoP 逻辑加速引擎能够在较复杂存储子系统
    的头像 发表于 09-14 11:31 4317次阅读
    NVMe高速传输之摆脱XDMA设计25: NVMe 子<b class='flag-5'>系统</b><b class='flag-5'>模型</b>设计

    绿氢系统 PEM 电解槽直流接入仿真验证深度解析

    实现设定值与实际运行参数的稳定跟随,验证结果表明 PEM 电解槽模块在直流接入模式下具有可行性。 EasyGo PEM 电解槽模型可为 PEM 电解槽在制氢领域的实际应用提供坚实的模型
    发表于 07-03 18:25

    运行kmodel模型验证一直报错怎么解决?

    我这运行kmodel模型验证一直报错,所以没法kmodel模型好坏验证,不知道怎么解决这个问题,重新训练一个kmodel
    发表于 06-10 08:02

    绿氢系统篇丨PEM电解槽模型交流接入模式仿真验证

    电解槽模型通过离线验证和实时仿真验证两种方式,对模型在交流接入模式的可行性进行全面验证,可为
    发表于 06-05 18:55

    绿氢系统篇丨PEM电解槽模型交流接入模式仿真验证

    离线验证和实时仿真验证两种方式,对模型在交流接入模式的可行性进行全面验证,可为PEM电解槽的实际应用提供理论和实践依据。一、PEM质子交换
    的头像 发表于 06-05 18:07 1418次阅读
    绿氢<b class='flag-5'>系统</b>篇丨PEM电解槽<b class='flag-5'>模型</b>交流接入模式仿真<b class='flag-5'>验证</b>

    从FA模型切换到Stage模型时:module的切换说明

    form_config.json。 srcLanguageAbility开发语言的类型。/Stage模型支持。 srcPath标签标识Ability对应的JS组件代码路径。srcE
    发表于 06-05 08:16

    企业部署AI大模型怎么做

    当下,AI大模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高、成本失控等困境。如何突破瓶颈,实现高效、稳定的AI部署呢?下面,AI部落小编为您分享。
    的头像 发表于 06-04 09:26 677次阅读

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 1375次阅读
    瑞萨RZ/V2H平台<b class='flag-5'>支持</b>部署离线版DeepSeek -R1大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    LTC5588-1的基带输入可以用单端的方式输入吗?具体怎么做

    LTC5588-1的基带输入可以用单端的方式输入吗?具体怎么做
    发表于 04-15 06:10

    ​VLM(视觉语言模型)​详细解析

    视觉语言模型(Visual Language Model, VLM)是一种结合视觉(图像/视频)和语言(文本)处理能力的多模态人工智能模型,能够理解并生成与视觉内容相关的自然
    的头像 发表于 03-17 15:32 7577次阅读
    ​VLM(视觉<b class='flag-5'>语言</b><b class='flag-5'>模型</b>)​详细解析

    语言模型的解码策略与关键优化总结

    本文系统性地阐述了大型语言模型(LargeLanguageModels,LLMs)中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工程师提供了全面
    的头像 发表于 02-18 12:00 1071次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的解码策略与关键优化总结

    企业AI模型托管怎么做

    当下,越来越多的企业选择将AI模型托管给专业的第三方平台,以实现高效、灵活和安全的模型运行。下面,AI部落小编为您介绍企业AI模型托管是怎么做的。
    的头像 发表于 01-15 10:10 727次阅读

    语言模型管理的作用

    要充分发挥语言模型的潜力,有效的语言模型管理非常重要。以下,是对语言模型管理作用的分析,由AI部
    的头像 发表于 01-02 11:06 573次阅读