0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

能效比较GPGPU高一个数量级,国产AI芯片让端侧AI大模型高质量落地

吴生semi 来源:电子发烧友网 作者:吴子鹏 2024-07-10 16:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)2024年世界人工智能大会(以下简称:WAIC 2024)依然是一场“百模大战”,不过有一些很明显的变化是:新推出的AI大模型更加注重用户体验;边侧和端侧承载AI大模型的方案越来越多。也就是说,AI大模型不仅完成了从“能用”到“好用”的蜕变,也从高高在上的云端,走到更靠近应用场景的边侧和端侧,这给作为方案核心的推理芯片提出了非常高的要求。

在爱芯元智于WAIC 2024举办的“芯领未来丨智能芯片及多模态大模型论坛”上,爱芯元智创始人、董事长仇肖莘在主旨演讲中表示,大模型真正大规模落地需要云边端三级紧密结合,而边侧和端侧结合的关键在于高能效的边端AI芯片。
爱芯元智创始人、董事长仇肖莘
仇肖莘指出,目前基于爱芯元智AI芯片已经完成非常多款AI大模型的适配,能够支持的参数规模覆盖0.3B-7B。“搭载AI处理器的高效推理芯片将是大模型落地更合理的选择,这也是推进普惠AI的关键所在。”

爱芯智眸AI-ISP和爱芯通元NPU
在AI芯片的研发上,爱芯元智打造了广受业界认可的爱芯智眸AI-ISP和爱芯通元混合精度NPU两大自研核心技术。其中,爱芯智眸AI-ISP是将深度学习算法与传统的ISP处理单元相结合,利用像素级AI处理技术,在各种复杂应用场景中,全面提升成像效果,为后期智能处理提供高质量的图像、视频素材,作为万物智能的“眼睛”感知更多信息,特别是暗光全彩的刚需。

爱芯通元混合精度NPU是以算子为原子指令集的AI计算处理器,采用多线程异构多核设计,实现算子、网络微结构、数据流和内存访问优化,高效支持混合精度算法设计,原生支持Transformer网络结构,为大模型在边缘侧、端侧的应用提供良好的基础。

仇肖莘谈到,爱芯元智现阶段奉行以“AIoT+ADAS”为主的一体两翼战略路线,在AI大模型进入边侧和端侧的过程中,智慧城市和智能汽车都是非常具有代表性的应用场景。“目前端侧大模型落地依然在前期探索阶段,我认为智能汽车、AI手机和AIPC将会是第一批落地的场景,智能驾驶之所以需要端侧大模型原因在于汽车对实时性的要求更高。”

爱芯智眸AI-ISP作为AI芯片的子系统,为解决很多端侧场景图像问题提供了强力支持。比如在智能驾驶场景中,爱芯智眸AI-ISP提供AI星光全彩、AI HDR成像、AI多光谱融合、AI防抖、AI场景增强、AI多传感器融合六大技术亮点,能够帮助智能汽车在大雨、大雾、夜间和隧道等恶劣的驾驶环境中获取清晰的图像。

当然,AI技术的发展也在推动AI-ISP的创新。以爱芯智眸AI-ISP来说,目前AI算法已经取代了降噪模块、防抖模块。仇肖莘认为,后续AI-ISP发展一个值得探索的方向是,AI-ISP是不是也能够成为一个“黑盒式”的AI大模型,用AI算法取代更多ISP中的功能单元,使得AI-ISP能够利用CMOS图像传感器信号直接成像,让用户不必再去考虑ISP工作的中间环节。

在AI芯片的打造上,爱芯通元混合精度NPU的优点不只是原生支持Transformer网络结构,还包括通过可编程数据流DSA架构,能够覆盖目前用户需要的基本算子,成本、效能和运算效率都非常高。仇肖莘说,“AI算法发展至今已经非常成熟,进入一个较为稳定的状态,因此用户对于算子的需求不再有日新月异的变化,这是爱芯元智能够打造通用AI处理器的关键。”

根据爱芯元智联合创始人、副总裁刘建伟的介绍,此次论坛上正式发布的爱芯通元AI处理器在高中低三档算力中已完成布局,并在智慧城市和辅助驾驶两个领域实现了规模化量产,能效比较GPGPU芯片提升了一个数量级,而在以文搜图、通用检测、以图生文、AI Agent等通用大模型应用中,爱芯通元AI处理器也可以让AI开发者以更低的成本进行高效开发。
爱芯元智联合创始人、副总裁刘建伟
让端侧更好地承载AI大模型 根据《2024年中国AI大模型产业发展报告》,截至2024年3月,国内部署大模型的企业数量超243家,以通用大模型为主。不过,我们都知道AI大模型成功的关键在于行业大模型、端侧、端云结合等多种模式并行。 端侧大模型的部署所面临的挑战和云端是完全不同的,需要克服能耗的限制,还需要在足够小的参数下,做到大部分日常工作。在WAIC 2024上,爱芯元智在自己的展台上也展示了其AI芯片在部署端侧大模型方面的能力。

案例一是基于爱芯元智端侧小芯片AX630C部署语言大模型——阿里云通义千问Qwen2.0。AX630C提供3.2T的算力,通过运载通义千问Qwen2.0,可以流畅地实现人机对话,查询信息、日常交流等任务。AX630C运载通义千问Qwen2.0每秒能处理超过10个信息单元,但功耗只有1.5瓦。

案例二是爱芯元智端AX650N结合CLIP模型可以实现以文搜图的功能,只需要一个词、一句话或一段文字,系统就能迅速准确地从海量图片中找到匹配项。

案例三是基于爱芯元智端AX650N运转多模态多维感知大模型OWL-ViT大模型,精准完成对未知目标检测,实现图像自动标签化。

正如上文提到的,爱芯通元AI处理器提供完备的算子集合,因此对于市面上的大模型能够提供非常好的支持,并且适配的速度是非常快的。比如,今年4月份,Meta发布了Meta Llama 3系列语言模型(LLM),具体包括一个8B模型和一个70B模型。随后不久,爱芯元智就宣布,爱芯通元AI处理器完成Llama 3和Phi-3大模型适配。在Llama 3模型的适配上,爱芯元智AX650N芯片适配了Llama 3 8B Int8版本,若采用Int4量化,每秒token数还能再翻一倍,能满足正常的人机交流。仇肖莘强调,爱芯元智的AI芯片对INT2、INT4、INT8、INT16混合精度算力都可以支持。


结语
AI大模型的发展已经进入一个新阶段,行业大模型以及云边端结合的大模型是下一步发展重点。在端侧运转大模型有不一样的挑战,能耗和参数规模都会受到限制,但用户体验不能打折。爱芯通元AI处理器以及爱芯元智AX650N等AI芯片展示出了非常好的端侧大模型支持能力,在普惠AI的道路上迈出了坚实一步。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI芯片
    +关注

    关注

    17

    文章

    2065

    浏览量

    36570
  • GPGPU
    +关注

    关注

    0

    文章

    31

    浏览量

    5380
  • 爱芯元智
    +关注

    关注

    1

    文章

    119

    浏览量

    5379
  • AI大模型
    +关注

    关注

    0

    文章

    394

    浏览量

    942
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    引领模型落地!Firefly-RK182X 开发套件上线发售

    海量参数的大模型AI行业带来颠覆性的体验,然而在设备中,由于有限的DRAM带宽、硬件算力、存储容量等瓶颈,
    的头像 发表于 11-26 16:33 839次阅读
    引领<b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b><b class='flag-5'>落地</b>!Firefly-RK182X 开发套件上线发售

    研华AI智能体推动储产业高质量发展

    储能行业正面临海量数据处理与AI应用挑战。研华科技推出软硬件体化控制方案,实现整站交付效率提升90%。该方案打通从数据采集到AI智能体构建的全链路,推动储系统向智能化升级,为产业
    的头像 发表于 11-02 15:43 650次阅读

    聚焦AI:看美格智能全栈能力如何支撑AI产业六大趋势

    当前阶段,AI技术的竞争已从模型的“宏大叙事”转向落地应用的“精耕细作”。当行业焦点回归现实效能,共识愈发清晰:计算的未来,正从云端向万
    的头像 发表于 10-29 16:09 828次阅读
    聚焦<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>:看美格智能全栈能力如何支撑<b class='flag-5'>AI</b>产业六大趋势

    此芯科技发布“合AI加速计划,赋边缘与AI创新

    产品组合,覆盖从1.5B至32B参数规模的AI模型推理需求,满足工业、消费电子、智能终端等多样化场景的部署需求,推动AI技术从云端向边缘
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合<b class='flag-5'>一</b>”<b class='flag-5'>AI</b>加速计划,赋<b class='flag-5'>能</b>边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    当主控SoC遇上AI模型,物奇智能蓝牙芯片驱动AI新场景

    ,成为AI落地的重要载体,将超越传统音频播放范畴,演变为人机交互的关键接口,带来前所未有的智能体验。 借助AI
    的头像 发表于 08-27 11:29 1.4w次阅读
    当主控SoC遇上<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,物奇智能蓝牙<b class='flag-5'>芯片</b>驱动<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新场景

    AI推理赋效率革命,美格智能多领域落地打造行业范本

    产业进阶:AI推理助手成为应用刚需作为人工智能技术最普遍的产品形式之,“AI助手”已成为各类软件、终端的重要组成部分,成为AIAgen
    的头像 发表于 08-25 17:06 3470次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>推理赋<b class='flag-5'>能</b>效率革命,美格智能多领域<b class='flag-5'>落地</b>打造行业范本

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    缺的是那些能把技术做成产品的工程师。”越来越多的AI芯片厂商开始提供SDK、开放板卡、量产评估工具,
    发表于 07-30 16:15

    浅析:数字经济时代,高质量数据集对AI产业带来哪些新的变化

    模型技术不断取得突破,其中大规模高质量训练数据的投入,起到了关键作用,也进步将 “以数据为中心的人工智能” 推向新阶段。从早期简单的
    的头像 发表于 05-09 15:10 746次阅读

    AI 芯片:终端智能落地的核心引擎

    AI 计算,构成了 AI 落地的核心硬件基础。   为何需要端
    的头像 发表于 04-14 02:11 4005次阅读

    首创开源架构,天玑AI开发套件AI模型接入得心应手

    模型、通义千问、混元等多种先进模型,还包含视觉、语言、多模态等多种多样的大模型,开发者可以通过Gen-
    发表于 04-13 19:52

    AI模型侧部署正当时:移远端AI模型解决方案,激活场景智能新范式

    AI模型解决方案备受瞩目,为AI设备的革新注入了澎湃动力。 万亿级市场蓝海显现,AI
    发表于 03-27 11:26 427次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧部署正当时:移远端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    AI模型侧部署正当时:移远端AI模型解决方案,激活场景智能新范式

    AI模型解决方案备受瞩目,为AI设备的革新注入了澎湃动力。万亿级市场蓝海显现,AI
    的头像 发表于 03-26 19:05 993次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧部署正当时:移远端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    广和通Fibocom AI Stack:加速AI部署新纪元

    、海量模型以及全方位的支持与服务于体,为智能设备提供了AI解决方案。为适应多样化的
    的头像 发表于 01-13 11:32 1430次阅读

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示生成
    的头像 发表于 01-03 10:38 1351次阅读
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b>生成<b class='flag-5'>高质量</b>图像

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的
    的头像 发表于 12-12 10:35 1294次阅读