0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智谱推出四个全新端侧模型 携英特尔按下AI普及加速键

looger123 来源:looger123 作者:looger123 2024-12-02 17:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI的发展,端侧AI模型越来越受到广大客户及厂商的关注,业界领先的大模型公司智谱于近日推出了四个全新的端侧模型,加速AI前沿技术路径与创新应用场景探索,推动AI大模型普惠化发展。

四个模型中,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat为端侧大语言模型,GLM-Edge-V-5B、GLM-Edge-V-2B为端侧多模态模型,这四个模型分别具有4.3B/1.5B/4.8B/2B参数量。两个端侧的大语言模型适合意图理解、智能对话、文本创作、知识库问答等,两个端侧的多模态模型适用于视觉理解、创意描述、本地搜索、图片问答等。这四个模型即将在Github、Huggingface、模搭等多个开源社区上发布。

为了确保这些新模型能够在实际应用中发挥卓越性能,英特尔与智谱紧密合作,利用最新的英特尔酷睿Ultra处理器(第二代)硬件平台和OpenVINOTMAI推理加速软件对模型的性能进行优化。通过与英特尔的紧密合作,智谱的新模型在计算效率、推理速度和能效比等方面得到了显著提升。

英特尔酷睿Ultra处理器集成了专门的AI加速器,显著提升AI和机器学习任务的处理能力。OpenVINOTM是由英特尔发起的AI推理优化部署软件框架,旨在优化和加速深度学习模型在各种英特尔硬件上的推理性能,提供高效的模型优化和跨平台部署能力,使得开发者能够在CPUGPU、NPU 等多种硬件上实现卓越的AI推理性能。

在强大的硬件基础上,OpenVINO采用多种优化策略对智谱模型进行优化。INT4低精度模型量化;基于kvcache的stateful模型优化;基于模型图融合优化,包括SDPA GQA,RoPE fusion等等。

通过这些优化,英特尔在基于酷睿Ultra第二代处理器的AIPC上做到了对相关模型的Day 0(第零日)支持并取得了很好的性能(如下图):

wKgZPGdNekqAGlFgAADawgzfCAM457.png

在AI PC领域,英特尔正在引领市场前行。英特尔目前已出货了超过2,000万台AIPC设备,构建了拥有超过100家ISV、300多项AI应用、500多个AI模型的庞大生态系统。

在产品层面,英特尔也在与OEM厂商密切合作,推出以酷睿Ultra处理器为核心的AIPC。酷睿Ultra同时实现了出色的性能和续航能力,基于强大的x86架构,通过CPU、GPU算力,酷睿Ultra能够充分发挥AI技术的优势。

未来英特尔会与智谱进一步加强在端侧模型上的合作,并利用酷睿Ultra处理器上不断提升的AI能力,充分赋能更多AIPC上的应用,让用户在基于英特尔酷睿Ultra的AIPC上有更好的体验。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179290
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296567
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3 AI加速器。
    的头像 发表于 05-21 00:57 6960次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新
    的头像 发表于 05-20 12:27 5154次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI
    发表于 05-20 11:03 1665次阅读

    英特尔与面壁智能宣布建立战略合作伙伴关系,共同研发端原生智能座舱,定义下一代车载AI

    今日,英特尔与面壁智能签署合作备忘录。双方宣布达成战略级合作伙伴关系,旨在打造端原生智能座舱,定义下一代车载AI。目前,双方已合作推出英特尔
    的头像 发表于 04-23 21:46 931次阅读
    <b class='flag-5'>英特尔</b>与面壁智能宣布建立战略合作伙伴关系,共同研发端<b class='flag-5'>侧</b>原生智能座舱,定义下一代车载<b class='flag-5'>AI</b>

    首创开源架构,天玑AI开发套件让AI模型接入得心应手

    AI巨头强强联手,势必为智能体化AI体验时代超级加速
    发表于 04-13 19:52

    英特尔借助开放生态系统,加速边缘AI创新

    英特尔推出全新AI边缘系统、边缘AI套件和开放边缘平台软件,赋能合作伙伴将AI无缝融入现有基础设
    发表于 03-21 11:31 302次阅读
    <b class='flag-5'>英特尔</b>借助开放生态系统,<b class='flag-5'>加速</b>边缘<b class='flag-5'>AI</b>创新

    高通推动终端AI释放全新价值

    通过蒸馏技术将百亿参数模型压缩至设备可运行的创新,让AI推理成本大幅下降,为终端AI的爆发
    的头像 发表于 03-21 09:28 980次阅读
    高通推动终端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>释放<b class='flag-5'>全新</b>价值

    英特尔与扣子云平台合作推出AI PC Bot专区和插件商店

    通过创新的云协同技术,为开发者提供更为便捷、高效的智能应用开发环境。 通过扣子的“插件”机制,英特尔AI PC的PC操控、本地知识库、本地推理以及本地生成等核心功能被巧妙地嵌入到扣
    的头像 发表于 12-31 10:24 1463次阅读

    英特尔与扣子云平台共推AI PC Bot专区和插件商店

    ,将英特尔AI PC的PC操控、本地知识库、本地推理及本地生成等核心功能无缝嵌入扣子大模型与工作流中。这一创新性的融合,为开发者提供了前所未有的便利。 通过“Coze-AIPC”平台的“
    的头像 发表于 12-30 10:09 1098次阅读

    英特尔与扣子云平台合作推出AI PC Bot专区与插件商店

    。 Coze-AIPC是扣子云平台与英特尔联合发布的增强版智能体开发平台,它深度整合了英特尔AI PC的能力与扣子云平台的优势。通过扣子
    的头像 发表于 12-27 14:11 1398次阅读

    发布清言英特尔酷睿Ultra专享版

    近日,国内知名大模型厂商智谱在其官方网站——智清言上,正式推出了针对英特尔酷睿Ultra处理器的专享版应用。这一版本充分利用了英特尔酷睿U
    的头像 发表于 12-24 10:49 1123次阅读

    发布智清言英特尔酷睿Ultra专享版

    近日,国内顶尖的大模型厂商智谱在官方网站智清言上,正式推出了智清言英特尔酷睿Ultra专享版。这一版本充分利用了
    的头像 发表于 12-19 11:37 987次阅读

    清言英特尔酷睿Ultra专享版发布,离线模型玩转AIPC

    近日,国内领先的大模型厂商智谱在智清言的官网发布了智清言英特尔酷睿Ultra专享版,这个版本可以利用英特尔酷睿Ultra处理器提供的澎湃
    的头像 发表于 12-18 11:52 923次阅读

    使用英特尔AI PC为YOLO模型训练加速

    之后,情况有了新的变化,PyTorch2.5正式开始支持英特尔显卡,也就是说,此后我们能够借助英特尔 锐炫 显卡来进行模型训练了。
    的头像 发表于 12-09 16:14 2101次阅读
    使用<b class='flag-5'>英特尔</b><b class='flag-5'>AI</b> PC为YOLO<b class='flag-5'>模型</b>训练<b class='flag-5'>加速</b>

    英特尔推出全新英特尔锐炫B系列显卡

    备受玩家青睐的价格提供卓越的性能与价值1,很好地满足现代游戏需求,并为AI工作负载提供加速。其配备的英特尔Xe矩阵计算引擎(XMX),为新推出的XeSS 2提供强大支持。XeSS 2的
    的头像 发表于 12-07 10:16 1920次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>推出</b><b class='flag-5'>全新</b><b class='flag-5'>英特尔</b>锐炫B系列显卡