0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Qwen2强势来袭,AIBOX支持本地化部署

Firefly开源团队 2024-06-27 08:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Qwen2 是阿里通义推出的新一代多语言预训练模型,经过更深入的预训练和指令调整,在多个基准评测结果中表现出色,尤其在代码和数学方面有显著提升,同时拓展了上下文长度支持,最高可达128K。目前 AIBOX-1684X 已适配 Qwen2 系列模型,并已集成在 FireflyChat 对话应用中,开机即可体验。

模型基础更新

预训练和指令微调模型

Qwen2系列包含5个尺寸的预训练和指令微调模型,所有尺寸模型都使用了 GQA(分组查询注意力)机制,方便用户体验到推理加速和显存占用降低的优势。

8c14884e-3418-11ef-a655-92fbcf53809c.png

加强27种语言的训练数据

Qwen团队通过扩展多语言预训练和指令微调数据的规模,针对除中英文以外的27种语言进行加强,提升模型的多语言能力。

8c2f0fd4-3418-11ef-a655-92fbcf53809c.png

模型多方面测评

8bfd3bbc-3418-11ef-a655-92fbcf53809c.png

基准测评结果

相比 Qwen1.5,得益于预训练数据及训练方法的优化,Qwen2 在大模型实现大幅度的效果提升。在针对预训练语言模型的评估中,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均表现卓越。

8c591f18-3418-11ef-a655-92fbcf53809c.jpg

小模型方面,相比近期推出的领先模型,Qwen2-7B-Instruct 依然能在多个评测上取得显著的优势,尤其是代码及中文理解。

8c83bef8-3418-11ef-a655-92fbcf53809c.jpg

代码和数学能力显著提升

代码方面,沿用 Qwen1.5 的代码能力,实现 Qwen2 在多种编程语言上的效果提升;数学方面,投入了大规模且高质量的训练数据提升 Qwen2-72B-Instruct 的数学解题能力。

8c936d3a-3418-11ef-a655-92fbcf53809c.jpg

长文本处理

Qwen2 系列模型中较为关注的功能是它能够理解和处理扩展的上下文序列,对于冗长文档的应用程序,Qwen2 可以提供更准确、全面的响应,实现长文本自然语言高效处理。在Needle in a Haystack的测试集上显示:Qwen2-7B-Instruct 几乎完美地处理长达128k的上下文。

8caacade-3418-11ef-a655-92fbcf53809c.png

Qwen2-7B本地化部署

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261473
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11253
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    涂鸦网关本地化进阶能力来袭!周期/区间/批量联动全掌控,解锁高阶场景应用

    在物联网自动场景体系中,网关是连接云端与终端设备的关键中枢,其本地化处理能力直接决定场景联动的可靠性与精细化水平。然而,传统自动场景多依赖云端判定与指令下发,在断网自控、复杂逻辑运算及批量设备
    的头像 发表于 11-27 18:27 147次阅读
    涂鸦网关<b class='flag-5'>本地化</b>进阶能力<b class='flag-5'>来袭</b>!周期/区间/批量联动全掌控,解锁高阶场景应用

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的本地部署
    的头像 发表于 10-29 16:59 1013次阅读

    发布元服务配置本地化基础信息(应用名称、图标)

    您可以添加元服务支持的语言,并配置对应语言的本地化信息。 例如,当您设置简体中文为默认语言,并且只配置中文的本地化信息,那么元服务在所有设置的发布国家或地区的信息都将显示中文。如果您还设置了英文
    发表于 10-24 17:42

    广和通成功部署DeepSeek-R1-0528-Qwen3-8B模型

    近日,广和通在MediaTek MT8893平台上成功部署并运行了DeepSeek-R1-0528-Qwen3-8B模型,显著提升了端侧AI设备的处理效率与智能水平,特别是在本地化
    的头像 发表于 09-26 13:35 665次阅读

    基于米尔瑞芯微RK3576开发板的Qwen2-VL-3B模型NPU多模态部署评测

    模型(如 Qwen2-VL-2B)进行专项优化,token 生成速度达 10+每秒,适配本地化多模态交互需求; 算力分配:RK3576 的 NPU 集成 512KB 共享内存,减少数据搬运开销,在轻量级
    发表于 08-29 18:08

    能源监测管理平台是本地化部署好还是云端部署好?

    能源监测管理平台本地化部署和云端部署各有优劣,企业需根据自身需求和实际情况来选择。如果企业对数据安全要求极高、网络环境特殊且预算充足,本地化部署
    的头像 发表于 07-22 15:16 327次阅读
    能源监测管理平台是<b class='flag-5'>本地化</b><b class='flag-5'>部署</b>好还是云端<b class='flag-5'>部署</b>好?

    AI+能源数字破局者故事5:斯伦贝谢 x IBM 咨询之 “全球经营与本地化适配”

    斯伦贝谢与 IBM 的合作建立在技术专长、交付能力及本地化支持的基础上,IBM 的强大技术实力和本地经验,使其成为斯伦贝谢推动数字转型的重要合作伙伴
    的头像 发表于 07-17 19:02 1111次阅读

    施耐德电气与奇安信共建技术本地化创新中心

     在施耐德电气技术本地化创新日上 ; 施耐德电气与奇安信集团宣布成立 施耐德电气(中国)技术本地化创新中心。 该中心将提供 针对国产基础软硬件的深度适配服务,以信息技术共创和生态协同为核心 ,更好
    的头像 发表于 07-10 19:01 776次阅读
    施耐德电气与奇安信共建技术<b class='flag-5'>本地化</b>创新中心

    AIBOX 产品矩阵:支持主流大模型的私有部署,满足个性 AI 应用需求

    AIBOX系列产品具备高性能、低功耗、环境适应性强等特点,算力覆盖6-157TOPS,通过搭配多样深度学习算法,体积小巧,能够支持主流大模型的私有
    的头像 发表于 06-25 16:32 1418次阅读
    <b class='flag-5'>AIBOX</b> 产品矩阵:<b class='flag-5'>支持</b>主流大模型的私有<b class='flag-5'>化</b><b class='flag-5'>部署</b>,满足个性<b class='flag-5'>化</b> AI 应用需求

    博实结完成DeepSeek大模型本地化部署

    近日,公司完成DeepSeek R1 671B大模型本地化部署。通过构建自主可控的AI基础设施,公司同步实现研发智能升级、研发成本重构、数据安全闭环与应用场景突破,为产业智能赋能。
    的头像 发表于 03-19 16:31 1017次阅读

    行芯完成DeepSeek-R1大模型本地化部署

    近日,行芯正式宣布完成 DeepSeek-R1 大模型本地化部署,实现在多场景、多产品中应用。解锁“芯”玩法,开启“芯”未来!
    的头像 发表于 02-24 15:17 1141次阅读

    曙光顺利完成DeepSeek大模型本地化多点私有部署

    计算中心等政务云服务商,依托本地政务云资源池,顺利完成DeepSeek大模型本地化多点私有部署,并打造出数字人“抚小智”。抚州市还计划将DeepSeek大模型成功落地到多个政务场景。这一成果的背后,曙光云凭借深耕政务领域的丰富经
    的头像 发表于 02-22 14:16 1101次阅读

    烽火通信推动DeepSeek本地化部署,金融行业率先示范

    近日,烽火通信携手长江计算、昇腾及华为云团队,在金融领域取得了重要突破。他们成功助力某国有大型银行,率先完成了DeepSeek-V3大模型的本地化推理服务部署。 此次部署采用了长江计算G440K
    的头像 发表于 02-10 15:03 1743次阅读

    意法半导体在中国的本地化战略

    提前谋划本地化供应链,解决中国客户后顾之忧,提高对汽车用MCU的重视,布局从高端到中低端的全线产品。ST带着这样的愿景开始了在中国市场的下一个40年!
    的头像 发表于 01-16 12:32 2436次阅读
    意法半导体在中国的<b class='flag-5'>本地化</b>战略

    爱普生科技+本地化引领五大创新

    自八十年代进入中国以来,爱普生已在中国市场上深耕近四十年。从打印机到工业机器人,爱普生业务遍布多个领域,始终秉承“科技+本地化”的核心理念,与中国市场同频共振,不断深化与本土合作伙伴合作,推出“中国定制”产品及解决方案。
    的头像 发表于 12-12 16:31 1067次阅读