0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔携手Aible打造创新解决方案,助力企业实现低成本智能化升级

looger123 来源:looger123 作者:looger123 2024-07-03 19:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于需要运行生成式AI工作负载的企业来说,基于英特尔至强处理器的Aible无服务器解决方案可帮助其降低成本、提高智能化,并有效提升RAG及微调效率

近日,英特尔与端到端Serverless(无服务器)生成式AI和增强型分析方案提供商Aible合作,为企业客户提供了创新的解决方案,助力其在不同代际的英特尔®至强®CPU上运行生成式AI与检索增强生成(RAG)用例。此次合作包含了工程优化和基准测试项目,显著增强了Aible以低成本为企业客户提供生成式AI结果的能力,并帮助开发人员在应用中部署AI。在双方的通力合作下,该可扩展、高效的AI解决方案可通过高性能硬件帮助客户迎接AI挑战。

wKgZomaFM1yAEigTAAN8h0PVHGc421.png

英特尔至强处理器

英特尔数据中心人工智能事业部高级首席工程师Mishali Naik表示:“现在,客户正在寻求高效的企业级解决方案以充分释放AI潜力。我们与Aible的合作,也表明了英特尔正与行业紧密协作,推动AI创新,降低客户使用英特尔至强处理器运行最新生成式AI工作负载的门槛。”

至强处理器的生成式AI性能:Aible的解决方案展示了CPU如何显著提升从运行语言模型至RAG的一系列最新AI工作负载性能。基于针对英特尔处理器的优化,Aible技术采用高效、智能的“端到端无服务器”方法,仅在产生用户请求时才会进行资源消耗。例如,基于用户查询,向量数据库仅需几秒即可激活并检索相关信息,而语言模型同样只需简单启动即可处理并响应用户请求,这种按需操作的运行模式有助于企业降低总拥有成本(TCO)。

虽然在多数情况下,RAG功能需通过利用GPU和加速器的并行处理能力来实现,但Aible的无服务器技术与英特尔至强处理器相结合,可使RAG用例完全由CPU来驱动。性能数据显示,多款不同代际的英特尔至强处理器均可高效运行RAG工作负载。

wKgaomaFM1yAWfmOAAOFuDBs-Nk034.png

配置详细信息如图,结果可能会有不同

重要意义:Aible通过无服务器的方式使用CPU,可在多个客户之间更为安全地共享底层计算资源,从而帮助客户有效降低生成式AI项目的运营成本。这种降低成本的方式可以类比为用户仅需在使用时购买电力,而非直接租赁发电机。此外,随着生成式AI需求的增长,性能优化和节能降耗变得愈发重要。Aible所提供的基于CPU的服务,为客户提供了一种经济、高效的解决方案。

根据Aible的基准测试分析,当客户采用基于CPU的无服务器解决方案运行RAG模型时,成本节省可高达55倍1。大幅降低的成本证明了Aible独家方法的有效性,同时这种无服务器的CPU采用方式也减少了通过共享服务或专用服务器构建更为昂贵的、基于GPU的基础设施需求。

此次英特尔及英特尔实验室与Aible的合作,共同优化了至强处理器上的AI工作负载。值得一提的是,通过优化Aible针对AVX-512的代码,Aible在至强处理器上实现了显著的性能及吞吐量提升,这也彰显了战略性的软件优化对于整体效率的影响。

在Aible平台的支持下,RAG模型与英特尔至强处理器的结合可推动以下应用落地:

自然语言处理(NLP)

推荐系统

决策支持系统

内容生成

英特尔与Aible的合作始于第四代至强处理器的发布。此后,双方针对至强处理器的AI工作负载、代码和库进行了一系列优化,并大幅提升了Aible的产品性能。

1英特尔不控制或审计第三方数据。您可咨询其他来源以评估准确性。

配置详情:

1节点,2x英特尔®至强® Platinum 8280L CPU,2.70GHz, 28核心,HT开启,Turbo开启,NUMA 2,集成加速器可用[已使用]:DLB 0 [0],DSA 0 [0],IAA 0 [0],QAT 0 [0],总内存384GB (12x32GB DDR4 2933 MT/s [2934 MT/s]),BIOS SE5C620.86B.02.01.0017.110620230543,微码0x5003604,2x以太网连接X722用于10GBASE-T,1x 894.3G英特尔SSDSC2KB96,1x 1.8T英特尔SSDPE2KX020T8,2x 3.7T英特尔SSDPE2KX040T8,Red Hat Enterprise Linux 8.9 (Ootpa),4.18.0-513.18.1.el8_9.x86_64,WORKLOAD=Aible端到端RAG-LLM,模型=Mistral-7B-OpenOrca-GGUF,all-MiniLM-L6-v2,gcc 12.2.0,IntelLLVM 2024.0.2,llama.cpp,ChromaDB,Langchain,oneAPI基础容器2024.0.1-devel-ubuntu22.04。基于英特尔03/07/24的测试。

1节点,2x英特尔®至强® Platinum 8462Y+,32核心,HT开启,Turbo开启,NUMA 2,集成加速器可用[已使用]:DLB 2 [0],DSA 2 [0],IAA 2 [0],QAT 2 [0],总内存512GB (16x32GB DDR5 4800 MT/s [4800 MT/s]),BIOS 05.12.00,微码0x2b0004d0,2x BCM57416 NetXtreme-E Dual-Media 10G RDMA以太网控制器,2x以太网控制器E810-C for QSFP,2x 3.5T三星MZQL23T8HCLS-00B7C,1x 1.8T三星MZ1L21T9HCLS-00A07,Red Hat Enterprise Linux 8.9 (Ootpa),4.18.0-513.18.1.el8_9.x86_64,WORKLOAD=Aible端到端RAG-LLM,模型=Mistral-7B-OpenOrca-GGUF,all-MiniLM-L6-v2,gcc 12.2.0,IntelLLVM 2024.0.2,llama.cpp,ChromaDB,Langchain,oneAPI基础容器2024.0.1-devel-ubuntu22.05。基于英特尔03/07/24的测试。

1节点,2x英特尔®至强® PLATINUM 8562Y+,32核心,HT开启,Turbo开启,NUMA 2,集成加速器可用[已使用]:DLB 2 [0],DSA 2 [0],IAA 2 [0],QAT 2 [0],总内存512GB (16x32GB DDR5 5600 MT/s [5600 MT/s]),BIOS 3B05.TEL4P1,微码0x21000161,2x以太网控制器X710用于10GBASE-T,2x以太网控制器E810-C for QSFP,1x 894.3G英特尔SSDSC2KG96,1x 3.5T三星MZQL23T8HCLS-00A07,3x 3.5T三星MZQL23T8HCLS-00B7C,Red Hat Enterprise Linux 8.9 (Ootpa),4.18.0-513.18.1.el8_9.x86_64,WORKLOAD=Aible端到端RAG-LLM,模型=Mistral-7B-OpenOrca-GGUF,all-MiniLM-L6-v2,gcc 12.2.0,IntelLLVM 2024.0.2,llama.cpp,ChromaDB,Langchain,oneAPI基础容器2024.0.1-devel-ubuntu22.06。基于英特尔03/07/24的测试。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179311
  • 智能化
    +关注

    关注

    15

    文章

    5209

    浏览量

    59708
  • 至强处理器
    +关注

    关注

    0

    文章

    23

    浏览量

    9331
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    打造智算基石:英特尔携手本土生态发布全域液冷服务器

    路冷板式全域液冷服务器。该创新方案由全本地生态赋能,实现了关键热源的高比例液冷覆盖,在提升可靠性与能效的同时,显著降低能耗与运维成本,为数据中心散热与能效树立全新标杆。 英特尔数据中心
    的头像 发表于 11-20 14:31 166次阅读
    <b class='flag-5'>打造</b>智算基石:<b class='flag-5'>英特尔</b><b class='flag-5'>携手</b>本土生态发布全域液冷服务器

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    11月19日,在2025英特尔行业解决方案大会上,英特尔展示了基于英特尔® 酷睿™ Ultra平台的最新边缘AI产品及解决方案,并预览了针对
    的头像 发表于 11-19 21:51 5132次阅读
    <b class='flag-5'>英特尔</b>举办行业<b class='flag-5'>解决方案</b>大会,共同<b class='flag-5'>打造</b>机器人“芯”动脉

    京东方携手英特尔推出首款AI驱动多频显示解决方案

    近日,BOE(京东方)与英特尔共同宣布,双方将携手推出基于人工智能技术的笔记本电脑显示屏节能解决方案。该方案融合AI多频显示(MFD)、1H
    的头像 发表于 11-11 10:13 2753次阅读

    英特尔以通感智算一体方案,驱动网络与边缘智能化升级

    无线网络、媒体应用等实践方案展开精彩分享。 英特尔中国网络与边缘事业部总经理阮伯超表示:“我们正步入一个万物互联与智能无处不在的时代,网络与边缘不仅是数据的入口,更是智能化应用的关键节
    的头像 发表于 09-25 11:55 384次阅读
    <b class='flag-5'>英特尔</b>以通感智算一体<b class='flag-5'>化</b><b class='flag-5'>方案</b>,驱动网络与边缘<b class='flag-5'>智能化</b><b class='flag-5'>升级</b>

    索尼推出针对直播行业的创新解决方案

    ”)的华镜软件*¹,可以将有限的商显画面进行拓展,以实现大尺寸、沉浸感的直播画面。索尼与双镜智能共同致力于打造兼顾品质和成本的革新性坐播直播方案
    的头像 发表于 07-23 16:08 764次阅读

    英特尔带来AI创新技能课程,为创新人才培养提供全栈支持

    教师代表齐聚一堂,围绕人工智能教育在中小学的实践路径、课程创新与生态共建以及创新人才培养展开深度讨论。 校企协同:打造AI教育新生态 英特尔
    的头像 发表于 04-28 17:29 536次阅读
    <b class='flag-5'>英特尔</b>带来AI<b class='flag-5'>创新</b>技能课程,为<b class='flag-5'>创新</b>人才培养提供全栈支持

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    英特尔智能座舱领域的创新产品组合。同时,英特尔还宣布与黑芝麻智能、面壁智能、BOS Semic
    的头像 发表于 04-23 21:20 990次阅读
    <b class='flag-5'>英特尔</b>首秀上海车展:以“芯”赋能,<b class='flag-5'>携手</b>合作伙伴推动全车<b class='flag-5'>智能化</b>

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    基于芯粒架构的设计,进一步扩展了英特尔智能座舱领域的创新产品组合。同时,英特尔还宣布与黑芝麻智能、面壁
    发表于 04-23 14:26 742次阅读

    英特尔® 具身智能大小脑融合方案发布:构建具身智能落地新范式

    套件和AI加速框架打造。凭借创新性地模块设计,其不仅能够兼顾操作精度和智能能力,而且以卓越的性价比满足不同领域需求,为具身
    发表于 04-18 17:26 912次阅读
    <b class='flag-5'>英特尔</b>® 具身<b class='flag-5'>智能</b>大小脑融合<b class='flag-5'>方案</b>发布:构建具身<b class='flag-5'>智能</b>落地新范式

    盟通科技携手Acontis助力英特尔虚拟驱动工业负载整合

    近期,盟通科技联合合作伙伴Acontis与英特尔针对虚拟驱动工业负载的整合这一课题展开了合作。Acontis经过多年技术积累,推出了成熟、可靠且高效的实时虚拟扩展方案,对于这些
    的头像 发表于 04-11 10:50 769次阅读
    盟通科技<b class='flag-5'>携手</b>Acontis<b class='flag-5'>助力</b><b class='flag-5'>英特尔</b>虚拟<b class='flag-5'>化</b>驱动工业负载整合

    2025英特尔人工智能创新应用大赛正式启动

    近日,2025英特尔人工智能创新应用大赛(以下简称“大赛”)正式启动。本届大赛以“‘码’上出发,‘芯’创未来”为主题,在赛制、规模、奖项和赛事支持上实现多重
    的头像 发表于 04-02 15:24 877次阅读

    部署成本显著降低!英特尔助阵高效AI算力一体机方案

    3月27日,英特尔举办了名为“‘至’绘未来,锐炫来袭”的创新解决方案研讨会,与生态伙伴共同分享最新AI算力一体机方案。该方案基于英特尔®至强
    的头像 发表于 03-29 16:29 1721次阅读
    部署<b class='flag-5'>成本</b>显著降低!<b class='flag-5'>英特尔</b>助阵高效AI算力一体机<b class='flag-5'>方案</b>

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    启明智显AI(人工智能解决方案加速传统企业智能化转型

    启明智显AI解决方案,将AI技术深入传统行业,支持多模态交互、生成式AIoT、灵活调用AI能力,通过快捷、经济的方案助力企业实现
    的头像 发表于 02-27 17:33 1042次阅读
    启明智显AI(人工<b class='flag-5'>智能</b>)<b class='flag-5'>解决方案</b>加速传统<b class='flag-5'>企业</b><b class='flag-5'>智能化</b>转型

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四代服务器实例,以打造弹性算力底座的产品实践。同时,
    的头像 发表于 12-23 14:05 1234次阅读