0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在AI基础设施中部署大语言模型的三大举措

颖脉Imgtec 2026-02-09 16:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

文:Gartner研究副总裁周玲


中国企业机构已逐步在生产环境中运行或者计划运行大语言模型,但在AI基础设施的生产部署与高效运营方面仍面临诸多挑战。目前,中国正加速提升其生成式AI能力,覆盖大语言模型、软件开发、生态集成与硬件革新。随着DeepSeek、通义千问(Qwen)等高性价比模型日益普及和本地部署的深入推进,越来越多的中国企业将重心放在数据隐私、数据主权、安全性、可扩展性和低延迟等核心需求上。2025年Gartner首席信息官(CIO)和技术高管调研显示,2025年中国企业计划大幅增加在生成式AI和AI领域的技术投资,其平均增幅分别达到40.3%和33.3%(见图1),这一数据表明,相关技术将在短期内得到广泛采用。

3e6abd4c-0591-11f1-96ea-92fbcf53809c.png

Gartner预测,到2028年,中国70%的大型企业将为大语言模型在AI基础设施上的部署建立完善的治理框架,而2025年这一比例不足10%。

然而,要成功实现大语言模型在AI基础设施中的生产部署并非易事,需要制定复杂的技术、运维和治理战略,以确保模型达到性能指标(例如GPU算力利用率),同时保障数据安全与合规。

中国企业与全球企业的一个关键区别在于,其更倾向于在本地AI基础设施环境中部署大语言模型,这对I&O团队提出了更高要求,需要他们对重要AI基础设施技术栈有更深入的理解。AI基础设施是指AI应用构建、测试、训练与部署所需的最新、最先进的硬软件技术栈。

为了在新的AI基础设施上成功实现大语言模型的生产部署,企业应从以下三个方面着手:构建全面的生产发布策略;制定健全的治理框架;并加强与法律、安全、AI、数据团队及生态伙伴的紧密协作。这些举措为大语言模型在生产环境中的高效运行提供了坚实的保障。


构建全面的部署战略

随着企业开始在AI基础设施上部署大语言模型,I&O领导者所面临的压力日益增大,需要帮助AI开发人员和工程师在全企业范围内以更快的速度、更大的规模来推进AI项目的开发和部署。与此同时,针对不同用户和应用场景不断涌现的各种AI工具和服务,显著增加了评估与选择的难度和复杂性。此外,传统的生产发布策略与流程已无法有效支持大语言模型在AI基础设施中的生产部署需求。因此,I&O领导者亟需制定完善的生产发布战略,以保障部署工作的顺利进行。

然而,要为大语言模型在AI基础设施上的部署构建一套稳健的战略,就需要从整体视角出发,包括适配AI基础设施环境、为特定场景设计架构、实施技术优化以及确保符合监管框架要求。

中国的I&O领导者应:

使部署策略与企业数字化转型战略保持一致

按照使用场景构建多层次部署架构以优化性能

优化模型与推理以提升效率

使用云原生技术实现灵活调度

加强合规并强化安全管理

建立全链路监控与成本控制机制


制定稳健的部署治理流程

大语言模型已经从研究原型转变为多种任务的关键核心组件,包括客户支持AI智能体、法律文档摘要、代码生成或测试工具、企业级代理型AI用例以及多模态应用等领域。然而,大语言模型在AI基础设施中的生产部署需要解决如下几个固有挑战:

资源密集

非确定性行为与提示敏感

延迟与吞吐限制

安全与隐私

因此,为了成功将大语言模型部署到AI基础设施的生产环境中,中国的I&O部门必须建立一套稳健的治理流程,采取切实可行的步骤促进资源管理、持续监控以及敏捷更新。比如:

提前规划并进行试点

确定产品部署位置

建立高效的资源管理

在大语言模型生产发布流程中嵌入安全治理与提示治理

管理版本并执行A/B测试

采用持续集成/持续交付流程

实施生产监控


促进关键利益相关方之间的紧密协作

部署大语言模型十分复杂,要求业务、法务、安全以及AI与数据团队以协同一致的方式共同工作。过去各自独立的部门如今必须从大语言模型项目的启动阶段就开展合作,以确保技术开发能够反映法律和安全方面的考量。建立跨职能的AI治理委员会至关重要,成员应包括法务、安全、数据工程与数据科学、产品管理、软件开发以及高管层的代表。

文章来源:Gartner

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41293

    浏览量

    302659
  • 人工智能
    +关注

    关注

    1820

    文章

    50364

    浏览量

    267015
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11345
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [完结15章]Java转 AI高薪领域必备-从0到1打通生产级AI Agent开发

    拒绝原地踏步:Java工程师AI转型的底层技术破局之道 软件工程范式被大语言模型(LLM)彻底颠覆的今天,传统的“Java CRUD boy”正面临着前所未有的生存危机。当业务逻辑
    发表于 04-30 13:46

    AI模型训练与部署实战 | 线下免费培训

    流程与部署实战”免费培训!以人形检测模型部署与优化实战为基础,聚焦嵌入式AI落地的核心环节,提供硬件,动手实操,带你半天时间内,走通从
    的头像 发表于 04-07 13:08 677次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>模型</b>训练与<b class='flag-5'>部署</b>实战 | 线下免费培训

    【瑞萨AI挑战赛】手写数字识别模型RA8P1 Titan Board上的部署

    提供了高性能、高易用性的硬件平台,而E2Studio与ruhmi框架的组合,大幅降低了模型端侧部署的门槛,相信工业检测、智能穿戴、智能家居等领域,该开发板与端侧AI
    发表于 03-15 20:42

    云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目

    日前,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目。根据项目规划,公司将基于自研国产AI推理加速卡,参与建设AI推理算力集群,并推动DeepSeek等国产大
    的头像 发表于 03-14 09:04 755次阅读

    为何CPU是AI基础设施的核心

    人工智能 (AI) 并非一种具有单一理想基础设施的单一工作负载。AI 涵盖了多样化的工作负载,需要系统层面的协同策略,才能高效且可扩展地提供性能。而在这一策略中,CPU 扮演着核心角色,它作为系统的智能层,统筹协调云端、数据中心
    的头像 发表于 03-11 10:35 1371次阅读

    华为推动电信云加速向AI基础设施演进

    随着AI技术持续突破,人工智能正成为全球产业升级的核心驱动力。从通用大模型到行业智能应用,AI已成为新一轮科技变革和产业升级的核心驱动力。业界正加快推进体系化探索,围绕AI
    的头像 发表于 02-27 09:43 408次阅读

    模型 ai coding 比较

    方裁判更客观 样本量说明:当前样本量30题,统计意义有限,建议后续扩大到100+题 数据污染风险:评估经典题目被模型训练集见过的可能性 6. 环境一致性维度 所有模型完全相同的环
    发表于 02-19 13:43

    亚马逊云科技推出全新的Amazon AI Factories 将客户现有基础设施转化为高性能AI环境

    亚马逊云科技2025 re:Invent全球大会上,宣布推出全新的Amazon AI Factories,助力企业将现有基础设施转化为高性能的AI环境。
    的头像 发表于 12-13 13:44 861次阅读

    使用瑞萨RUHMI工具实现AI模型部署过程

    AI无处不在。你部署AI,你的竞争对手也部署AI
    的头像 发表于 10-17 10:00 2953次阅读
    使用瑞萨RUHMI工具实现<b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>过程

    科士达全栈解决方案亮相2025 ODCC,驱动绿色AI智算基础设施革新

    2025年开放数据中心大会(ODCC)于9月9日-11日北京国际会议中心盛大启幕。本届峰会以“拥抱AI变革,点燃算网引擎”为主题,聚焦AI爆发背景下算力基础设施面临的能效、
    的头像 发表于 09-17 15:40 1402次阅读
    科士达全栈解决方案亮相2025 ODCC,驱动绿色<b class='flag-5'>AI</b>智算<b class='flag-5'>基础设施</b>革新

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进
    发表于 07-28 10:34 2927次阅读
    摩尔线程“<b class='flag-5'>AI</b>工厂”:以系统级创新定义新一代<b class='flag-5'>AI</b><b class='flag-5'>基础设施</b>

    Arm如何助力AI基础设施变革

    众所周知,人工智能 (AI) 有望革新人类活动的方方面面。然而,要充分释放这一潜力,就必须面对一个基本事实:支撑传统计算的基础设施已无法满足未来 AI 发展的需求。
    的头像 发表于 07-03 14:29 1149次阅读

    欧洲联手NVIDIA打造AI基础设施

    NVIDIA 于近日宣布,其正在携手欧洲各国、科技和行业领导者,共同建造 NVIDIA Blackwell AI 基础设施,以强化数字主权、支撑经济增长,并推动欧洲大陆成为 AI 工业革命的领导者。
    的头像 发表于 06-16 14:25 1658次阅读

    企业部署AI模型怎么做

    当下,AI模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高、成本失控等困境。如何突破瓶颈,实现高效、稳
    的头像 发表于 06-04 09:26 1027次阅读