0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GAITC2025|张科:端云一体大模型推理应用实战

京东云 来源:jf_75140285 作者:jf_75140285 2025-06-26 09:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期,2025全球人工智能技术大会(GAITC2025)于杭州盛大开幕,汇聚全球顶尖科学家、技术领袖及行业先锋,共同探讨人工智能技术产业化新趋势。京东零售AI Infra &大数据计算负责人张科受邀出席并在《行业大模型应用与发展》论坛发表演讲,首次深入介绍京东零售在端云一体大模型推理架构的实战经验与技术探索,并分享AI推理方向的未来发展思考。以下为张科分享实录,内容经编辑略有删减:

电商场景AI推理的挑战

大模型技术突飞猛进,大模型不仅是算法和算力的集合体,更是产业智能化的新底座,正在推动AI从“可用”向“好用、可控、可信”迈进。电商场景作为AI技术的应用场,逐步形成了三个主要的需求方向:

Generative AI

(如AI生成商品图、短视频、AI营销内容生成、AI数字人)、

Agentic AI

(如AI客服与售后管理、AI经营托管、AI仓配优化 、AI交互式推荐)、

Physical AI

(如自动分拣机器人、智能空间、自动驾驶)。在复杂场景与多元需求的驱动下,AI推理正面临一系列技术挑战,包括输入类型多样、用户需求优先级不同;端(如手机)和云(服务器)之间任务分配难、协同优化难;模型压缩和性能优化等问题。

京东零售联合清华大学推出 xLLM 端云一体大模型推理架构

2022年起,京东与清华大学开启深度合作,在计算机视觉机器学习、推荐系统、大数据等领域联合开展了十余项课题研究。今年双方进一步拓展合作边界,新增

大模型推理引擎国产化、多模态推荐大模型

等前沿方向,聚焦整合技术资源与学术优势,共同探索前沿技术创新,推动科研成果向实际生产力转化。自今年初大模型推理引擎国产化合作开展以来,京东零售和清华大学一起在大模型量化压缩、端-云协同推理引擎等方向联合攻坚,并提出“xLLM 端云一体大模型推理架构”,以解决推理引擎的性能优化问题、助力大模型技术在复杂电商环境的规模化落地。通过端云联合部署,实现高效协同推理。利用终端用户数据和反馈,云端模型持续优化并实时更新终端轻量化模型,形成闭环进化系统,提高模型在实际场景中的性能。该架构还可适应不同终端设备资源限制,实现大模型更广泛复用。

xLLM端云一体大模型推理架构中的技术探索还表现在以下4个方面:

1.自适应调度优化:

动态调整Prefill与Decode节点比例,实现动态的自适应弹性PD能力。

2.在离线统一调度:

根据负载实时调度在离线请求,实现请求级别的在离线混部的能力。

3.多层流水线执行:

最大化资源利用率,通过调度和模型执行异步流水线、不同Layer的计算和通信异步流水线、不同计算单元、访存并行流水线的多层流水线执行。

4.端云Agent协同:

端Agent处理简单任务与隐私数据,云 Agent 不断反馈优化,提升端 Agent 能力,并基于高效 Agent 协议协同。目前该推理架构已经在内部多个场景应用,在可交互式导购、商品对比、商品总结、购物建议等环节,大幅提升了响应速度,节省了计算成本,同时还有效助力了用户的活跃度。在核心的商品理解环节,也有效提升了大模型的理解能力和信息处理能力,模型推理成本最高可节省70%。

AI推理方向的未来思考

在现有技术探索的基础上,未来京东还将持续加大对国产 AI 基础设施的投入力度,着力构筑自主可控的技术生态体系。京东将重点聚焦三大前沿方向展开深入研究:

破解规模、效率、成本的 “不可能三角”、推进(端云)多智能体异步自进化、端云分布式推理的可解释和可调试

。通过上述布局,京东希望逐步实现主流国产芯片的深度适配优化,并基于自主研发的大模型推理框架,推动技术效率达到国际先进水平。也希望和业界同行共探技术边界、一起前行。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38087

    浏览量

    296412
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261444
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4961
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为举办数字政府应急行业小安大模型一体机推介会

    2025年9月18日,以“跃升行业智能化”为主题的华为全联接大会2025在上海举办。期间,华为公司举办了数字政府应急行业“小安大模型一体机”推介会,北京安信创业信息科技发展有限公司总工
    的头像 发表于 09-20 14:49 1221次阅读

    解决方案 | 一体化OTA HIL测试解决方案

    TOSUN一体化OTAHIL测试解决方案随着智能网联汽车的快速发展,OTA(Over-the-Air)技术已成为车辆软件升级的核心手段。为满足日益严格的法规要求和技术挑战,同星智能(TOSUN
    的头像 发表于 09-19 20:03 470次阅读
    解决方案 | <b class='flag-5'>云</b>管<b class='flag-5'>端</b><b class='flag-5'>一体</b>化OTA HIL测试解决方案

    迅为RK3568开发板模型推理测试实战LPRNet 车牌识别

    迅为RK3568开发板模型推理测试实战LPRNet 车牌识别
    的头像 发表于 08-25 14:55 1067次阅读
    迅为RK3568开发板<b class='flag-5'>模型</b><b class='flag-5'>推理</b>测试<b class='flag-5'>实战</b>LPRNet 车牌识别

    华为亮相2025金融AI推理应用落地与发展论坛

    近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布AI推理
    的头像 发表于 08-15 09:45 943次阅读

    中国信通院发布“2025计算十大关键词”

    、大模型工程化交付、大模型一体机、终端、智能混合卓越架构、央国企“
    的头像 发表于 07-30 10:53 2841次阅读
    中国信通院发布“<b class='flag-5'>2025</b><b class='flag-5'>云</b>计算十大关键词”

    蚂蚁数正式发布金融推理模型

    7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数正式发布了金融推理模型Agentar-Fin-R1
    的头像 发表于 07-28 16:36 530次阅读

    首创开源架构,天玑AI开发套件让侧AI模型接入得心应手

    AI巨头强强联手,势必为智能化AI体验时代按下超级加速键。 AI终端的下步是“普适智能”,而不是“极限性能”。联发凭借天玑9400+强悍的侧AI能力,加上从
    发表于 04-13 19:52

    硅基觉醒已至前夜,联发携手生态加速智能化用户体验时代到来

    ,芯片能力的跃迁都是切的起点。从率先落地侧AI大模型,到打造天玑AI智能化引擎,联发
    发表于 04-13 19:51

    华为发布一体化网络安全解决方案

    3月20日至21日,以“因聚而生 众智有为”为主题的华为中国合作伙伴大会2025在深圳举行。期间,华为数据通信产品线安全分销领域总监峰在“华为坤灵直播间”面向中小企业发布
    的头像 发表于 03-21 17:28 1651次阅读

    中科曙光助力天翼打造“翼政通”大模型一体

    近来,DeepSeek系列模型在政务领域展现出强大的赋能潜力。天翼选择曙光AI解决方案,凭借内置的DeepAI深算智能引擎,完成软硬件适配与深度调优,联合打造出“翼政通”大模型一体
    的头像 发表于 03-13 11:35 1411次阅读

    曙光发布DeepSeek大模型超融合一体

    近日,曙光在技术创新领域再度发力,震撼发布了全国产DeepSeek大模型超融合一体机。这革命性的产品不仅彰显了曙光在AI和
    的头像 发表于 02-17 11:11 1090次阅读

    曙光推出DeepSeek大模型一体

    近日,曙光震撼发布全国产DeepSeek大模型超融合一体机。这创新产品将为政府和企业的数字化、智能化转型按下“加速键”。
    的头像 发表于 02-14 18:02 1658次阅读

    从科技从容大模型训推一体机成功适配DeepSeek

    了新的动能。 从容大模型训推一体机是从科技基于昇腾AI基础软硬件平台推出的创新产品。该产品集成了大模型一体化生产平台,具备
    的头像 发表于 02-14 15:44 1352次阅读

    新华三发布DeepSeek大模型一体机UniCube

    ,为各行各业的智能进化注入了全新动力。 UniCube一体机实现了671B DeepSeek大模型的单机推理及单机训推一体服务,这意味着用户可以在单个设备上完成
    的头像 发表于 02-11 15:21 1851次阅读

    广汽ADiGO SENSE一体模型与DeepSeek-R1大模型完成深度融合

      2025年2月8日,段实车视频演示了广汽智能车机借助DeepSeek-R1大模型回答语音提问的表现,这标志着广汽自主研发的ADiGO SENSE
    的头像 发表于 02-10 09:21 2064次阅读