0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为亮相2025金融AI推理应用落地与发展论坛

华为 来源:华为 2025-08-15 09:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布AI推理创新技术——UCM推理记忆数据管理器,旨在推动AI推理体验升级,提升推理性价比,加速AI商业正循环。同时,华为携手中国银联率先在金融典型场景开展UCM技术试点应用,并联合发布智慧金融AI推理加速方案应用成果。

当前,人工智能已步入发展深水区,AI推理正成为下一个爆发式增长的关键阶段,推理体验和推理成本成为了衡量模型价值的黄金标尺。周跃峰在论坛上强调:“AI时代,模型训练、推理效率与体验的量纲都以Token数为表征,Token经济已经到来”。为保障流畅的推理体验,企业需持续加大算力投入,但如何在推理效率与成本之间找到最佳平衡点,成为了全行业亟待解决的重要课题。

为此,华为重磅推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”:

更优的推理体验:依托UCM层级化自适应的全局前缀缓存技术,系统能直接调用KV缓存数据,避免重复计算,使首Token时延最大降低90%。同时,UCM将超长序列Cache分层卸载至外置专业存储,通过算法创新突破模型和资源限制,实现推理上下文窗口10倍级扩展,满足长文本处理需求。

更低的推理成本:UCM具备智能分级缓存能力,可根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动;同时融合多种稀疏注意力算法,实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2-22倍,显著降低每Token推理成本,为企业减负增效。

在与中国银联的联合创新技术试点中,UCM的技术价值得到充分验证。在中国银联“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒即可精准识别客户高频问题,促进服务质量提升。未来,中国银联将依托国家人工智能应用中试基地,联合华为等生态伙伴共建“AI+金融”示范应用,推动技术成果从“实验室验证”走向“规模化应用”。

论坛现场,华为正式公布了UCM开源计划。UCM通过开放统一的南北向接口,可适配多类型推理引擎框架、算力及存储系统。今年9月,UCM将正式开源,后续逐步贡献给业界主流推理引擎社区,携手全产业共同推动AI推理生态的繁荣发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35783

    浏览量

    260702
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296527
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261487

原文标题:破解效率与成本难题:华为UCM技术推动AI推理体验升级

文章出处:【微信号:huaweicorp,微信公众号:华为】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为破解HBM依赖!AI推理黑科技UCM上线,9月正式开源

    8月12日,在2025金融AI推理应落地发展论坛
    的头像 发表于 08-13 08:58 9693次阅读
    <b class='flag-5'>华为</b>破解HBM依赖!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上线,9月正式开源

    华为重磅亮相2025中国酒店业数字化发展论坛

    中国酒店与餐饮业品牌发展大会暨中国酒店业数字化发展论坛隆重召开,本次论坛以“人机协同 智能原生——酒店业AI创新与实践”为主题,深入剖析住宿
    的头像 发表于 12-01 10:37 332次阅读

    华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案

    AI产业已从“追求模型能力极限”转向“追求推理体验最优化”,推理体验决定用户与AI的交互质感。当前推理应用快速
    的头像 发表于 11-28 10:03 188次阅读
    <b class='flag-5'>华为</b>数据存储与「DaoCloud 道客」发布<b class='flag-5'>AI</b><b class='flag-5'>推理</b>加速联合解决方案

    华为发布并开源创新AI容器技术Flex:ai

    11月21日,2025AI容器应用落地发展论坛在上海举行。华为公司副总裁、数据存储产品线总裁周跃峰博士在
    的头像 发表于 11-25 15:34 340次阅读

    灵犀微光亮相2025光电技术与产业发展论坛

    由西湖大学、西湖大学光电研究院携手西富芯(杭州)科技服务有限公司承办,中关村光电子集成产业联盟鼎力支持的2025 光电技术与产业发展论坛,以 “聚光汇智 产研融合” 为核心主题,于西湖大学光电研究院
    的头像 发表于 11-14 17:52 2390次阅读

    华为亮相2025城市大安全AI产业发展峰会

    11月5日,由宜兴市大数据发展有限公司与华为技术有限公司联合主办的一场聚焦人工智能与城市安全深度融合的行业盛会:“共聚AI泛生态 智启产业新未来——城市大安全AI产业
    的头像 发表于 11-10 14:38 545次阅读

    华为王飞亮相2025车联网中国发展与国际合作论坛

    昨日,5GAA在上海国际汽车城举办2025车联网中国发展与国际合作论坛华为无线网络产品线5G-A领域副总裁王飞受邀发表主题演讲。他表示,汽车正在向网联化和智能化飞速
    的头像 发表于 10-30 11:06 441次阅读

    爱芯元智亮相2025全球AI芯片峰会

    2025全球AI芯片峰会(GACS 2025)近日在上海召开,爱芯元智联合创始人、副总裁刘建伟出席活动,并于“大模型AI芯片专题论坛”发表主
    的头像 发表于 09-26 15:49 670次阅读

    脑启社区亮相2025大湾区AI产业论坛

    2025年8月28日,“2025大湾区AI产业论坛AI玩具创新产品发布会” 在深圳国际会展中心盛大召开。
    的头像 发表于 09-01 16:57 1089次阅读

    润和软件智慧金融解决方案亮相WAIC 2025

    2025世界人工智能大会(WAIC 2025)上,作为深耕金融科技领域的领先服务商和人工智能领域的创新先锋企业,润和软件携JettoAI 测试智能助手平台、消保助手、研报助手等在内的系列智慧
    的头像 发表于 07-31 16:06 950次阅读
    润和软件智慧<b class='flag-5'>金融</b>解决方案<b class='flag-5'>亮相</b>WAIC <b class='flag-5'>2025</b>

    蚂蚁数科正式发布金融推理大模型

    7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布了金融推理大模型Agentar-Fin-R1
    的头像 发表于 07-28 16:36 530次阅读

    奥托立夫亮相2025全球新能源汽车合作发展论坛

    6月24日-25日,由中国电动汽车百人会主办的2025全球新能源汽车合作发展(上海)论坛(GNEV2025•Shanghai ),在上海隆重举行。
    的头像 发表于 06-26 18:09 869次阅读

    GAITC2025|张科:端云一体大模型推理应用实战

    出席并在《行业大模型应用与发展论坛发表演讲,首次深入介绍京东零售在端云一体大模型推理架构的实战经验与技术探索,并分享AI推理方向的未来
    的头像 发表于 06-26 09:33 401次阅读

    研华科技亮相COMPUTEX 2025

    研华以“Edge Computing & WISE-Edge in Action”为主题亮相COMPUTEX 2025,双馆联展、论坛演讲、直播座谈多点联动,全面展现边缘AI在机器人、
    的头像 发表于 05-23 15:25 725次阅读

    华为AI WAN在智算边缘推理网络中的关键优势

    此前, 2025年3月24日至27日,MPLS&SRv6 AI Net World Congress 2025在法国巴黎会议中心举办。华为数据通信IP标准化高级代表李呈发表了题为“
    的头像 发表于 04-09 09:53 839次阅读