0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高通:未来几个月有望在终端侧运行超100亿参数的模型

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-07-26 00:15 次阅读

电子发烧友网报道(文/李弯弯)日前,在2023世界半导体大会暨南京国际半导体博览会上,高通全球副总裁孙刚发表演讲时谈到,目前高通能够支持参数超过10亿的模型在终端上运行,未来几个月内超过100亿参数的模型将有望在终端侧运行。

大模型在终端侧运行的重要性

生成式AI正在快速发展,数据显示,2020年至2022年,生成式AI相关的投资增长425%,初步预估生成式AI市场规模将达到1万亿美元。

然而孙刚指出,云经济难以支持生成式AI规模化拓展,为实现规模化拓展,AI处理的中心正在向边缘转移。比如XR、汽车、手机、PC、物联网,生成式AI将影响各类终端上的应用。

高通在这方面展示出了领先的优势,高通AI引擎由多个硬件和软件组件组成,用于在骁龙移动平台上为终端侧AI推理加速。它采用异构计算架构,包括高通Hexagon处理器Adreno GPU、Kryo CPU传感器中枢,共同支持在终端上运行AI应用程序。

在7月初的2023年世界人工智能大会上,高通就已经展示了全球首个在终端侧运行生成式AI(AIGC)模型Stable Diffusion的技术演示,和全球最快的终端侧语言-视觉模型(LVM)ControlNet运行演示。这两款模型的参数量已经达到10亿-15亿,仅在十几秒内就能够完成一系列推理,根据输入的文字或图片生成全新的AI图像。

今年7月18日,Meta官宣将发布其开源大模型LLaMA的商用版本,为初创企业和其他企业提供了一个强大的免费选择,以取代OpenAI和谷歌出售的昂贵的专有模型。随后,高通发布公告称,从2024年起,Llama 2将能在旗舰智能手机和PC上运行。

高通技术公司高级副总裁兼边缘云计算解决方案业务总经理Durga Malladi表示,为了有效地将生成式人工智能推广到主流市场,人工智能将需要同时在云端和边缘终端(如智能手机、笔记本电脑、汽车和物联网终端)上运行。

在高通看来,和基于云端的大语言模型相比,在智能手机等设备上运行Llama 2 等大型语言模型的边缘云计算具有许多优势,不仅成本更低、性能更好,还可以在断网的情况下工作,而且可以提供更个性化、更安全的AI服务。

如何让大模型在终端规模化扩展

生成式AI进入未来生活的趋势已经不可阻挡,为了让生成式AI规模化扩展到更多终端设备中,高通提出了混合AI架构的运行方式,即在云端和设备终端的边缘侧之间分配算力,协同处理AI工作负载。

所谓混合AI,是指充分利用边缘侧终端算力支持生成式AI应用的方式,相比仅在云端运行的AI,前者能够带来高性能、个性化且更安全的体验。

比如,如果模型、提示或生成内容的长度小于某个限定值,且精度足够,推理就可以完全在终端侧进行;如果任务相对复杂,则可以部分依靠云端模型;如果需要更多实时内容,模型也可以接入互联网获取信息

在未来,不同的生成式AI用不同分流方式的混合AI架构,AI也能在此基础上持续演进:
‍大量生成式AI的应用,比如图像生成或文本创作,需求AI能够进行实时响应。在这种任务上,终端可通过运行不太复杂的推理完成大部分任务。

在AI计算的实现上,软件和硬件同样重要,因为必须在端侧做到运算更快,效率更高,并推动AI应用在广泛终端上的部署和普及。

高通在2022年6月推出AI软件栈(Qualcomm AI Stack),其支持包括TensorFlow、Pytorch和ONNX在内的所有主流开发框架,所有runtimes(运行时,即某门编程语言的运行环境)和操作系统。借助高通AI软件栈,开发者在智能手机领域开发的软件可以快速扩展至汽车、XR、可穿戴设备等其他产品线进行使用。

高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar表示,未来公司需要加大终端侧技术上的研发,尤其是进一步提升量化的算法。例如服务器上训练的模型一般采用32位浮点运算(FP32),而我们在手机端现在能够支持INT4计算,这能大大提高端侧的处理能力。

小结

不仅仅是大模型的训练需要极大的算力和功耗,部署也同样如此。如果要让大模型在更多的领域实现落地应用,除了在云端部署之后,在终端侧部署也很关键。目前已经有诸多厂商在该领域进行探索,包括高通,期待未来大模型能够走进人们生活的方方面面。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高通
    +关注

    关注

    76

    文章

    7166

    浏览量

    187899
收藏 人收藏

    评论

    相关推荐

    STM8L运行一段时间后死机,手动复位无效,只能上电复位怎么解决?

    我们的是电池供电,LDO给主板供电,设备在用户手上运行一段时间后,莫名死机,回来拆机发现STM8L RST管脚始终处于低电平,必须拔电池上电才能复位,复位后一切正常,之后几个月都不会再出现。其它设备也发现这种现象,没有规律。找不到诱发因素,也无法复现,导致至今都找不到解决
    发表于 04-15 07:56

    真实用户体验,终端模型能为信息无障碍做些什么

    终端模型
    脑极体
    发布于 :2024年03月20日 17:04:44

    COMSOL Multiphysics材料与表面仿真中的应用

    领域带来了全新的研究方向和应用前景。 COMSOL Multiphysics是一款功能强大的多物理场仿真软件,能够对表面进行精确的仿真分析。通过建立三维模型,并设置相应的物理场参数,可以实现对
    发表于 02-20 09:20

    AD-96TOF1-EBZ无法识别驱动及DragonBoard410c无法运行demo是由什么原因导致的?

    驱动程序。 然后,我使用了内置龙牌中的linux系统。当我运行aditof-demo.sh时,程序闪回,闪回之前显示以下错误报告。 几个月前我正常使用了它,但最近出现了这些错误
    发表于 12-27 07:13

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    和1750亿参数的GPT-3都是非常由有竞争力的 MetaAI研究人员认为,当前大模型成本阻碍了学术研究,因此,开发出这个更小更强的模型
    发表于 12-22 10:18

    电机水里泡了几个月的时间,启动电机就启动不了了是为什么?

    电机水里泡了几个月的时间,启动电机就启动不了了,是不是电机烧了呢?
    发表于 12-11 06:39

    联发科天玑9300最高可运行330亿参数AI大模型

    联发科天玑9300最高可运行330亿参数AI大模型 联发科这个是要把AI大模型带到手机端的节奏吗?联发科正式发布了天玑9300旗舰5G生成式AI移动芯片,天玑9300号称最高可
    的头像 发表于 11-07 19:00 1108次阅读

    地平线旭日3成功部署运行参数规模高达14亿的大语言模型

    近日,地平线成功在旭日3中的BPU计算单元上,部署运行参数规模高达14亿的大语言模型(Large Language Model , LLM)。这不仅是业界在端侧成功部署大模型的一次突破
    的头像 发表于 09-12 09:24 515次阅读

    瑞昱再获急单 下半年出货有望逐季回温

    法人指出,瑞昱最近成功地顾客订购电视soc紧急订单了,这也是几个月又一次的大客户紧急订单,客户的目标主要是针对消费者市场需求,下半年、瑞昱在今年3/4季度运营有望持续加热。
    的头像 发表于 08-02 11:47 535次阅读

    RISC -V跑大模型(一)

    去年,ChatGPT的出现震惊了全世界,在短短几个月的时间内,ChatGPT的月活跃用户达到了1亿。ChatGPT的成功让许多人第一次知道了大语言模型(Large Language Model
    的头像 发表于 07-17 15:13 444次阅读
    RISC -V跑大<b class='flag-5'>模型</b>(一)

    天垓100率先完成百亿级参数模型训练,天数智芯迎来新的里程碑

    的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数模型训练的能力。
    发表于 06-12 15:46 97次阅读
    天垓<b class='flag-5'>100</b>率先完成百亿级<b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>训练,天数智芯迎来新的里程碑

    天数智芯天垓100率先完成百亿级参数模型训练

    的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数模型训练的能力。
    的头像 发表于 06-12 15:23 617次阅读
    天数智芯天垓<b class='flag-5'>100</b>率先完成百亿级<b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>训练

    浅析推理加速引擎FasterTransformer

    最近几个月,随着ChatGPT的现象级表现,大模型如雨后春笋般涌现。而模型推理是抽象的算法模型触达具体的实际业务的最后一公里。
    的头像 发表于 05-18 14:32 2150次阅读
    浅析推理加速引擎FasterTransformer

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    过去几个月,AI 几乎已经成为全民热议的话题。各式开源大模型、训练框架层出不穷;AI 技术也加速应用在各个领域和行业,例如服务运营优化、解决供应链问题等等;数据库、云计算、大前端等多类技术领域产品
    发表于 05-09 09:49

    国产MCU有望未来成为行业领导者吗?

    芯片,但随着国内芯片制造水平的提高,一些国产MCU产品开始逐渐崭露头角,并有望未来成为行业领导者。 首先,国产MCU产品已有一定的市场占有率。一些企业,如华大基因、瑞芯微等,已经推出了自己的MCU产品
    发表于 05-08 17:32