0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

支持大语言模型的AIoT系统设计难度在哪?该怎么做设计验证?

芯华章科技 来源:芯华章科技 2023-07-17 16:56 次阅读

ChatGPT成为今年现象级的热门应用后,一个说法也在行业里悄然流传开——1万枚英伟达A100芯片,是做好大模型训练的入门级装备。一时之间“洛阳纸贵”,AI芯片成为了大家眼中的“屠龙宝刀”。我们看到,大量抓住机遇的人,不仅投身大模型产品,还有一部分负责给“掘金人”卖铲子。

那么问题来了:

支持大语言模型的AIoT系统,

设计难度在哪?

该怎么做设计验证?

藏在“屠龙刀”里面的秘籍究竟是什么?

过去的AIoT,通常指的都是带低算力的端侧小芯片,但是随着类似ChatGPT的大语言模型全面得到应用,在端侧AIoT芯片上部署需要几十到几百TOPS算力的LLM大模型也成为新的需求。但是新一代AIoT芯片要提高十倍到百倍算力,这不仅仅是堆砌算力那么简单,需要从性能、互连、带宽、接口进行全面的系统级规划和设计。

新一代的AIoT芯片已经不是一个独立的芯片个体,目前市场上的AIoT芯片几乎都结合了CPUGPUFPGADSP等核心零部件。这就必然需要支持系统级芯片开发的EDA流程。

实际上,芯片设计厂商也意识到了这个问题。当制程工艺逼近极限,但人们对电子产品性能的追求还在不断攀升时,压力很快就传导到了上游的芯片厂商。借助面向系统级的创新,提升芯片的终极性能表现,也成为大家的共识。

所以没有任何分歧,无论从哪个维度看,大规模的系统级芯片设计由于场景丰富、系统规模不断扩张,这一需求正在快速形成市场主流的大浪,涌向EDA工具并推动其不断革新。

如何做好大系统芯片设计?

2023年7月13日至14日,备受期待的第三届中国集成电路设计创新大会(ICDIA 2023)在无锡召开。作为国内领先的系统级验证EDA解决方案提供商,芯华章受邀参加此次盛会,在“AIoT与ChatGPT”分论坛上针对大系统芯片设计挑战,分享了自己的解决方案。

大系统芯片设计,首先要理解什么叫“系统”?对高性能AIoT、自动驾驶、高性能CPU和GPU等等复杂应用来说,系统意味着多节点互联,每个节点都有自己的控制单元(如CPU)和计算单元(如AI、NPU),每个节点都有自己的操作系统和应用软件。

毫无疑问,大系统是一个软硬件一体化、多节点一体化的复杂平台,但也只有把这整个平台都在芯片流片前验证通过,才能真正保证高性能复杂芯片设计的正确性。

因此,大系统芯片验证,最直接的挑战来自于规模庞大的系统级仿真但困难远不止于此,由“大”带来的结构性挑战,涵盖了从验证到调试的方方面面。而更大的设计本身往往意味着更长的时间、更高昂的成本、更慢的仿真性能,本质上也就意味着更困难的验证。

在当下的技术和市场环境下,大系统芯片设计的验证面临三大共性难题,这些难题正是传统的EDA工具所难以解决的痛点:

设计大,很大,大到放不下

从多核、Chiplet封装、多节点到完整系统,复杂的验证规模可以轻易达到百亿甚至千亿门,对验证工具的容量提出了更高的要求,试想如果验证平台根本无法仿真完整的应用系统,又怎么能证明设计是完整正确的?但供数十亿至数百亿规模容量的验证平台,其性能、规模、可调试性又往往成为难以平衡的选择。

验证慢,很慢,难以收敛的慢

系统级规模不断增大,系统级仿真在整个验证的仿真流程中比例不断增大,导致验证团队特别依赖性能和数量有限的硬件仿真系统,导致验证慢的不仅仅是仿真速度,更是整个验证工作的收敛速度和效率。

Debug难,很难,越往后越难

在如此复杂和大规模的系统级仿真上,调试就变成一个更加困难的问题。仿真平台上观察到的问题,到底来自软件、芯片逻辑设计还是多节点互连?问题能否稳定复现?如何在多种仿真平台的数据之间进行综合分析?不解决这些问题,大系统的调试就会越往后期越难,最终影响整个项目周期。

我们似乎开始找到“屠龙刀里秘籍”的线索。作为最上游的辅助设计工具,EDA创新确实是提升系统级设计效率,降低创新成本的关键“钥匙”。

芯华章资深产品与业务规划总监杨晔表示,“单个IP的验证需求在降低,SoC或单个chiplet级的验证需求在不断上升,因为这部分是客户系统级创新的核心。然而在新场景的应用中,传统的EDA工具在应对大容量、深度调试、多种验证场景混合使用的时候,遇到各种效率挑战。芯华章致力提供从软件、硬件到调试的整体解决方案,特别是在大规模设计的系统级验证、硬件验证、架构验证等方面,将为用户提供全流程大系统芯片验证解决方案。”

b2ea95de-247f-11ee-962d-dac502259ad0.png

芯华章大系统芯片设计验证解决方案的核心,是基于敏捷验证理念,建立统一的EDA数据库,打造从IP到子系统再到系统级的统一测试场景,提早开始系统级验证,实现验证与测试目标的高速收敛,进行高效率、高效益的快速迭代,从而助力芯片及系统公司提高验证效率,降低研发成本。

b2ffae56-247f-11ee-962d-dac502259ad0.png

芯华章针对大规模系统级芯片“量身打造”的敏捷验证方案,已经在多个领域获得具体项目部署。

针对自动驾驶应用芯片,芯华章高性能硬件仿真系统HuaEmu E1不仅有高性能仿真和深度调试,还提供了LPDDR5模型用于客户内存仿真,提供CSIDSI模型用于仿真自动驾驶系统的输入和输出,这些都超出了单颗芯片的范畴,是针对软硬件一体化的系统方案进行仿真验证。

为了解决原型系统和硬件仿真之间切换版本成本高,延长验证周期的问题,芯华章发布的双模硬件验证系统HuaPro P2E则基于统一的软件平台和硬件平台,可以在综合、编译、验证方案构建、用户脚本、调试等阶段,能最大程度的复用技术模块和中间结果,并使用统一用户界面,从而实现原型验证和硬件仿真丝滑的无缝集成,在节约用户成本的同时,还能大大提高验证效率。

传统的软件仿真工具以调试功能强大著名,但却受限于仿真速度,不擅长处理系统级的大规模仿真验证。基于芯华章自主研发的逻辑仿真器GalaxSim,芯华章GalalxSim Turbo实现多核、多服务器并行运算,可以实现1K-10KHz的复杂系统软件仿真,从而可以在RTL阶段提前进行系统级仿真。

拿到屠龙刀并不一定能号令天下,只有学会了刀里面的绝学才能真正成为“武林至尊”。

当“大模型”的路上人越来越多时,产业同样也需要向上游追溯,进一步提升创新效率,在激烈的竞争中快人一步。作为芯片产品定义和创新的核心环节,随着以系统级场景为代表的产业数字化需求迸发,EDA正从方法学、从底层架构开始这场自我革新。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    545

    文章

    7666

    浏览量

    344844
  • FPGA
    +关注

    关注

    1606

    文章

    21349

    浏览量

    594267
  • EDA工具
    +关注

    关注

    4

    文章

    260

    浏览量

    31312
  • AIoT芯片
    +关注

    关注

    0

    文章

    31

    浏览量

    3769
  • ChatGPT
    +关注

    关注

    28

    文章

    1466

    浏览量

    5332

原文标题:支持大语言模型的下一代AIoT系统该怎么做设计验证?

文章出处:【微信号:X-EPIC,微信公众号:芯华章科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    语言模型:原理与工程实践+初识2

    前言 深度学习是机器学习的分支,而大语言模型是深度学习的分支。机器学习的核心是让计算机系统通过对数据的学习提高性能,深度学习则是通过创建人工神经网络处理数据。近年人工神经网络高速发展,引发深度学习
    发表于 05-13 00:09

    语言模型:原理与工程时间+小白初识大语言模型

    解锁 我理解的是基于深度学习,需要训练各种数据知识最后生成自己的的语言理解和能力的交互模型。 对于常说的RNN是处理短序列的数据时表现出色,耳真正厉害的是Transformer,此框架被推出后直接
    发表于 05-12 23:57

    【大语言模型:原理与工程实践】大语言模型的应用

    ,它通过抽象思考和逻辑推理,协助我们应对复杂的决策。 相应地,我们设计了两类任务来检验大语言模型的能力。一类是感性的、无需理性能力的任务,类似于人类的系统1,如情感分析和抽取式问答等。大
    发表于 05-07 17:21

    【大语言模型:原理与工程实践】大语言模型的评测

    计算和代码纠错等。这些场景覆盖日常生活和学习的多个方面,使得对话能力评测变得尤为复杂和关键。为了全面评估大语言模型在各种应用场景下的对话能力,研究人员和使用者需要一套综合性的评测框架。框架主要包括评测
    发表于 05-07 17:12

    【大语言模型:原理与工程实践】大语言模型的预训练

    数据格式的转换、数据字段的匹配和整合等。通过数据级净化,可以进一步提高数据的质量和可用性,为后续的数据分析和建模提供更有价值的数据支持。 在得到了大语言模型的数据之后,就是对其进行预训练。大圆
    发表于 05-07 17:10

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践》2.0

    《大语言模型“原理与工程实践”》是关于大语言模型内在机理和应用实践的一次深入探索。作者不仅深入讨论了理论,还提供了丰富的实践案例,帮助读者理解如何将理论知识应用于解决实际问题。书中的案
    发表于 05-07 10:30

    【大语言模型:原理与工程实践】大语言模型的基础技术

    不同语境下的不同语义。而动态词向量语言模型中对词的表示随着上下文语境的不同而动态变化,依赖当前所在的句子或段落等的语境。以ELMo为例,将词序列输入经过预训练的ELMo模型
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    。这一过程的不断迭代使大语言模型语言理解和生成能力逐步提升。大语言模型在自然语言处理领域应用广
    发表于 05-04 23:55

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践》

    《大语言模型》是一本深入探讨人工智能领域中语言模型的著作。作者通过对语言模型的基本概念、基础技术
    发表于 04-30 15:35

    高通支持Meta Llama 3大语言模型在骁龙旗舰平台上实现终端侧执行

    高通和Meta合作优化Meta Llama 3大语言模型支持在未来的骁龙旗舰平台上实现终端侧执行。
    的头像 发表于 04-20 09:13 214次阅读

    华为云盘古大模型通过金融大模型标杆验证,获最高评级

    验证标准主要关注金融大模型语言,语音,视觉以及多模态任务等多元领域的适应能力,涵盖数据合规性,模型安全性和服务稳定性等关键要素。
    的头像 发表于 03-04 15:58 274次阅读

    语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言模型
    的头像 发表于 12-04 15:51 470次阅读

    腾讯发布混元大语言模型

    腾讯发布混元大语言模型 腾讯全球数字生态大会上腾讯正式发布了混元大语言模型,参数规模超千亿,预训练语料超2万亿tokens。 作为腾讯自研的通用大
    的头像 发表于 09-07 10:23 899次阅读

    循环模型编译器Verilog和System Verilog语言支持指南

    本节介绍循环模型编译器响应不受支持或被忽略的构造的行为。 一般而言,Cycle Model Compiler支持Verilog和SystemVerilog语言的大部分可合成子集。 如果
    发表于 08-12 06:55

    支持语言模型的下一代AIoT系统怎么做设计验证

    ,大量抓住机遇的人,不仅投身大模型产品,还有一部分负责给“掘金人”卖铲子。   “  那么问题来了: 支持语言模型AIoT
    发表于 07-17 17:45 665次阅读
    <b class='flag-5'>支持</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的下一代<b class='flag-5'>AIoT</b><b class='flag-5'>系统</b>该<b class='flag-5'>怎么做</b>设计<b class='flag-5'>验证</b>?