0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

爱芯通元NPU完成Llama 3和Phi-3大模型适配,推动AI大模型技术普及

爱芯元智AXERA 来源:爱芯元智AXERA 2024-04-26 16:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

背景

AI大模型技术的持续进步正在推动千行百业智能化升级。近日,Meta、Microsoft相继发布具有里程碑意义的Llama 3系列和Phi-3系列模型,其中Llama 3包括8B、70B两种规格,Phi-3包括mini(3.8B)、small(7B)、medium(14B)三种规格。为了进一步给开发者提供更多尝鲜,爱芯元智的NPU工具链团队迅速响应,已基于AX650N平台完成 Llama 3 8B和Phi-3-mini模型适配。

Llama 3

上周五,Meta发布了Meta Llama 3系列语言模型(LLM),具体包括一个8B模型和一个70B模型在测试基准中,Llama 3模型的表现相当出色,在实用性和安全性评估中,与那些市面上流行的闭源模型不相上下。

ef8a8238-03a9-11ef-a297-92fbcf53809c.png

在架构层面,Llama 3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3使用了超过15T的公开数据进行训练,其中5%为非英文数据,涵盖30多种语言,训练数据量是前代Llama 2的七倍。

根据Meta的测试结果,Llama 3 8B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct,70B模型则超越了名声在外的闭源模型Claude 3的中间版本Sonnet,和谷歌的Gemini Pro 1.5相比三胜两负。

efa71060-03a9-11ef-a297-92fbcf53809c.png

实际上板结果

目前AX650N已经完成了Llama 3 8B Int8版本的适配,若采用Int4量化,每秒token数还能再翻一倍,能满足正常的人机交流。

Phi-3

Llama 3刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。

本周二,微软发布了自研小尺寸模型Phi-3。尽管Phi-3-mini被优化至可部署在手机上,但它的性能可以与Mixtral 8x7B和GPT-3.5等模型相媲美。微软表示,该创新主要在于用了质量更好的训练数据集。

efcbd13e-03a9-11ef-a297-92fbcf53809c.jpg

efe2ec48-03a9-11ef-a297-92fbcf53809c.png

实际上板结果

目前AX650N已经完成了Phi-3-mini Int8版本的适配,已能满足正常的人机交流。

其他成果

AX650N能第一时间完成Llama 3和Phi-3的适配,源于今年以来相关团队悄悄完成了现有NPU工具链针对大语言模型的支持和调优。目前除了Llama 3之外,已经完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等国内外主流的开源大语言模型适配。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NPU
    NPU
    +关注

    关注

    2

    文章

    393

    浏览量

    21434
  • 爱芯元智
    +关注

    关注

    1

    文章

    146

    浏览量

    5605
  • LLM
    LLM
    +关注

    关注

    1

    文章

    351

    浏览量

    1412
  • AI大模型
    +关注

    关注

    0

    文章

    419

    浏览量

    1054

原文标题:爱芯通元NPU完成Llama 3和Phi-3大模型适配,推动AI大模型技术应用普及

文章出处:【微信号:爱芯元智AXERA,微信公众号:爱芯元智AXERA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微(EASY EAI)RV1126B AI模型转换

    1.AI模型转换本章主要说明如何实现HuggingFace格式的大语言模型(LargeLanguageModel,LLM)如何转换为RKLLM模型,目前支持的
    的头像 发表于 05-13 16:58 350次阅读
    瑞<b class='flag-5'>芯</b>微(EASY EAI)RV1126B <b class='flag-5'>AI</b><b class='flag-5'>模型</b>转换

    海光信息深算3号DCU深度适配腾讯混Hy3 preview大模型

    近日,海光信息自主研发的深算3号DCU已完成与腾讯最新开源大模型 —— 混Hy3 preview的全面深度
    的头像 发表于 05-12 17:49 1469次阅读

    昆仑科技完成商汤日日新SenseNova U1系列大模型极速适配

    近日,商汤正式发布并开源原生理解生成统一模型——商汤日日新SenseNova U1系列。在模型发布当日,昆仑完成对SenseNova U1的极速
    的头像 发表于 05-06 10:55 579次阅读

    燧原科技L600适配腾讯混Hy3 preview语言模型

    2026年4月23日,腾讯混 Hy3 preview 语言模型发布并开源,燧原 L600已同步完成对 Hy3 preview极速全面
    的头像 发表于 04-28 15:13 311次阅读
    燧原科技L600<b class='flag-5'>适配</b>腾讯混<b class='flag-5'>元</b>Hy<b class='flag-5'>3</b> preview语言<b class='flag-5'>模型</b>

    天数智深度适配腾讯混开源Hy3 preview大模型

    应用落地树立新标杆。作为国内通用 GPU 领军企业,天数智以全栈自研算力资源底座与深度优化能力,为混 Hy3 preview 的高效推理、规模化部署与生态开放提供坚实支撑,携手推动
    的头像 发表于 04-24 17:56 1994次阅读
    天数智<b class='flag-5'>芯</b>深度<b class='flag-5'>适配</b>腾讯混<b class='flag-5'>元</b>开源Hy<b class='flag-5'>3</b> preview大<b class='flag-5'>模型</b>

    昆仑科技完成MiniMax M2.7模型极速适配

    今日,MiniMax正式开源MiniMax M2.7模型。昆仑同步完成对该模型的Day 0适配与深度优化,成为首批实现
    的头像 发表于 04-13 17:07 596次阅读

    智边缘AI芯片AX8850完成CosyVoice2大模型适配

    今年下半年,随着业务推广需求增加,我们的大模型适配工作也有了新方向:不再只追求前沿模型的快速适配,而是更聚焦为销售团队提供“能打”的实战“弹药”——也就是贴近客户刚需的、可快速落地的大
    的头像 发表于 12-11 10:35 5696次阅读
    <b class='flag-5'>爱</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智边缘<b class='flag-5'>AI</b>芯片AX8850<b class='flag-5'>完成</b>CosyVoice2大<b class='flag-5'>模型</b><b class='flag-5'>适配</b>

    【CIE全国RISC-V创新应用大赛】基于 K1 AI CPU 的大模型部署落地

    llama.cpp 引擎本身兼容 Q2_K,Spacemit 的硬件加速(X60 NPU)通常对矩阵乘法通用,即使 NPU 不支持 Q2,CPU (RVV) 也会自动接管,保证任务“成功
    发表于 11-27 14:43

    智边缘AI芯片AX8850完成Qwen3-VL多模态大模型适配

    适配 Qwen3-VL-2B/4B/8B 到 AX8850 开发板和 M.2 算力卡,可在本地完成图片内容理解和视频概要生成,可配合“树莓派5”使用。
    的头像 发表于 11-26 13:57 3563次阅读
    <b class='flag-5'>爱</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智边缘<b class='flag-5'>AI</b>芯片AX8850<b class='flag-5'>完成</b>Qwen<b class='flag-5'>3</b>-VL多模态大<b class='flag-5'>模型</b><b class='flag-5'>适配</b>

    如何利用NPU模型压缩技术优化边缘AI

    AI 模型体积庞大,部署在 NPU上常常面临困难,这凸显了模型压缩技术的重要性。要实现高效的实时边缘
    的头像 发表于 11-07 15:26 1491次阅读
    如何利用<b class='flag-5'>NPU</b>与<b class='flag-5'>模型</b>压缩<b class='flag-5'>技术</b>优化边缘<b class='flag-5'>AI</b>

    智亮相2025全球AI芯片峰会

    2025全球AI芯片峰会(GACS 2025)近日在上海召开,智联合创始人、副总裁刘建伟出席活动,并于“大模型
    的头像 发表于 09-26 15:49 1260次阅读

    基于米尔瑞微RK3576开发板的Qwen2-VL-3B模型NPU多模态部署评测

    关键词:瑞微 RK3576、NPU(神经网络处理器)、端侧小语言模型(SLM)、多模态 LLM、边缘 AI 部署、开发板、RKLLM随着大语言
    发表于 08-29 18:08

    智携手灵境声学推出“声”音频解决方案

    Umix AI”全景声行业大模型的专属音频芯片方案——“声”。该方案搭载灵境声学自研的“灵境Umix
    的头像 发表于 08-01 10:43 5290次阅读

    智亮相2025世界人工智能大会

    近日,2025年世界人工智能大会(WAIC 2025)正式开幕,智作为行业领先的人工智能感知与边缘计算芯片创新研发企业,再次亮相展会。在这场为期3天的展会上,
    的头像 发表于 08-01 10:41 2015次阅读

    使用 NPU 插件对量化的 Llama 3.1 8b 模型进行推理时出现“从 __Int64 转换为无符号 int 的错误”,怎么解决?

    安装了 OpenVINO™ GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    发表于 06-25 07:20