0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型后训练时代,九章云极DataCanvas公司打造普惠算力服务新范式

爱云资讯 2024-09-14 16:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月12日,由工业和信息化新闻宣传中心承办的“算力服务高质量发展论坛”在2024中国国际服务贸易交易会期间召开,九章云极DataCanvas公司AI首席科学家缪旭受邀出席论坛,并发表“大模型后训练时代的算力服务思考”主旨演讲。

本次论坛以“以算凝力,融创未来”为主题,汇聚来自政、产、学、研界多位重量嘉宾,剖析算力产业最发展新趋势,分享算力基础设施建设实践经验,共同探讨算力服务高质量发展之道。

论坛上,缪旭先生在演讲中表示,随着基础模型面临的挑战不断升级与复杂化,大模型后训练模式正在崛起,成为应对上述挑战的关键路径。然而后训练模式的复杂性与高度定制化需求,对算力资源的精准调度、灵活配置和高效利用提出了前所未有的高标准挑战,企业亟需高质量、高效能、更经济、更好用的算力服务新范式

wKgZomblQqmAXikdAAfckuDBgSE217.png

九章云极DataCanvas公司AI首席科学家缪旭发表演讲

更自动、更高效、更精准大模型后训练模式崛起

缪旭指出,当前基础模型发展迅猛,拥有广泛的行业应用潜力,但也面临着提示词工程复杂度高、难以规避的幻觉问题、规划能力不足以及高昂的成本负担等核心挑战。缪旭表示,通过大模型后训练策略的补足,可以有效应对上述瓶颈。

大模型后训练的核心策略为,在大模型基础训练完成后,通过使用新的数据集或任务对模型进行再次训练,以提高模型的适应性和性能。这个过程通常包含提示词设计、模型微调、embedding优化及调度优化等多个环节。

具体而言,大模型后训练的过程如下:将复杂的业务逻辑梳理并封装成独立的、可管理的任务模块;随后针对每个单一任务模块实施精准的后训练微调,以增强其针对特定任务的适应性和性能。在完成模块集成重组后,结合业务系统及用户的互动反馈,持续进行自我学习和自我增强,最终实现模型性能自动、高效的持续提升。

wKgZomblQqqAW3QRAAOAM_pDtcc532.png

大模型后训练方法的补足

新标准、新需求、新模式普惠算力开启AI新时代

在大模型后训练的过程中,算力调度尤为关键,包括训练期的数据准备调度、微调任务编排,以及推理阶段的动态加载和异构算力管理。通过在调度过程中引入可训练的调度模型,在优化目标时增加效率和成本计算,结合线上、线下收集的数据持续优化调度模型,可以从软件层面有效提升算力调度能力,并降低计算成本,使算力应用更加贴近实际应用场景。

wKgZomblQqmARmvQAAJXCKyCe1A284.png

不同任务工作流的安排调度

在数据存储与处理的关键环节,大模型后训练模式对系统的安全性提出了更高要求,以确保算力资源能够无缝且安全地融入各类业务系统。依托业务系统与互联网的海量数据资源,以任务为驱动,大模型可以智能识别任务需求,自动收集并处理所需数据,生成高质量的微调数据集。此外,应用存算一体架以构可以有效降低数据传输的带宽消耗,提升数据处理的整体效率与安全性。

面对不同行业、不同场景的多样化大模型后训练需求,基于Alaya NeW高效的算力管理内核,九章云极DataCanvas公司提出国际首创的算力服务新范式,凭借统一性能基准、资源管理优化、方便估算成本收益、算力一体化等优势,提出了统一的算力服务计量单位“度”(DCU),并用其实现标准化的算力计量计费,让算力消费者轻松获得好用、经济、普惠的算力服务,实现算力资源0浪费。此外,通过提供完整的大模型+Agent开发工具链,Alaya NeW为各行业用户提供灵活的大模型和AI Agent定制能力,加速人工智能技术在各领域的深度融合与广泛应用。

作为国内领先的人工智能基础设施提供商,九章云极DataCanvas公司将继续坚持AI技术的自主创新,以领先的AI智算产品推动算力服务向更高质量、更高水平迈进,深度赋能千行百业的数智化转型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42088

    浏览量

    303113
  • 算力
    +关注

    关注

    2

    文章

    1781

    浏览量

    16858
  • 大模型
    +关注

    关注

    2

    文章

    3870

    浏览量

    5300
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技报到:信通院《智能服务研究报告(2026年)》深度解析 产业迎来关键破局点

    科技报到原创。 2026年,生成式AI与大模型的规模化落地,把智能力推到了数字经济的C位。从千亿参数模型的跨域训练、亿级用户的高并发推理
    的头像 发表于 05-12 09:42 546次阅读
    科技<b class='flag-5'>云</b>报到:信通院《智能<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务</b>研究报告(2026年)》深度解析 <b class='flag-5'>算</b><b class='flag-5'>力</b>产业迎来关键破局点

    尖信息正式推出G7866 X6 8U16卡服务器 破解行业困境

    尖信息正式推出全新一代G7866 X6 8U16卡服务器。该产品以“高性能硬件配置+创新架构设计”为核心,通过8U机架高度集成16块高性能
    的头像 发表于 05-06 11:07 1120次阅读

    中科曙光scaleX40超节点让落地有路可循

    4月2日,工业和信息化部印发《关于开展赋能中小企业发展专项行动的通知》,明确提出到2028年底建成
    的头像 发表于 04-08 11:24 611次阅读

    基于国科微 GK7206V1 芯片:视美泰“ AOV + 黑光 + AI大模型”IPC 产品矩阵解决方案发布

    黑光AOV视觉处理芯片,重磅推出全新一代以AOV+黑光+全栈AI大模型为核心的智能IPC解决方案。方案以芯片为底层底座,
    的头像 发表于 03-20 17:03 1.5w次阅读
    基于国科微 GK7206V1 芯片:视美泰“ AOV + <b class='flag-5'>普</b><b class='flag-5'>惠</b>黑光 + AI大<b class='flag-5'>模型</b>”IPC 产品矩阵解决方案发布

    监控的下半场:从基础设施报警到精算师

    摘要: 在十万卡集群与万亿参数模型时代,基础设施的稳定性直接决定了模型训练的边际成本。当单次训练成本高达千万美元时,监控系统不再是简单的报警
    的头像 发表于 03-18 11:13 472次阅读

    弘信电子以绿色破局智成本飙升挑战

    2026年3月,全球AI产业遭遇深刻的结构性调整。以腾讯混元大模型为代表的核心API计费大幅上调,最高涨幅接近5倍。这一举动标志着行业正加速告别“高补贴、低门槛”的蛮荒时代,正式步入以价值锚定成本
    的头像 发表于 03-17 09:56 572次阅读

    训练到推理:大模型需求的新拐点已至

    在大模型产业发展的早期阶段,行业焦点主要集中在大模型训练所需的投入。一个万亿参数大模型
    的头像 发表于 02-05 16:07 1125次阅读
    从<b class='flag-5'>训练</b>到推理:大<b class='flag-5'>模型</b><b class='flag-5'>算</b><b class='flag-5'>力</b>需求的新拐点已至

    GPU 利用率<30%?这款开源智平台让不浪费 1%

    一套 AI 服务要折腾几天,环境配置、依赖处理耗尽心力;运维告警凌晨轰炸,集群故障诊断如同大海捞针,MTTR(平均修复时间)高得离谱…… AI 时代浪费,早已成为制约企业 AI
    的头像 发表于 01-26 14:20 343次阅读

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    专访铭时代,磁性元件如何破局?

    在 2025 中国电力电子与能量转换大会暨展览会与中国电源学会第二十八届学术年会上,磁性元件圈聊得最热的话题,莫过于 “赛道的磁技术机遇”。 作为深耕磁性元件行业多年的头部企业,铭光磁工程总监
    的头像 发表于 11-14 10:45 998次阅读
    专访铭<b class='flag-5'>普</b>:<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>时代</b>,磁性元件如何破局?

    与电力的终极博弈,填上了AIDC的“电力黑洞”

    ),专注于提供人工智能训练与推理所需的服务、数据服务和算法服务。AIDC采用异构计算架构,结
    的头像 发表于 09-22 02:43 9251次阅读

    科技银河存储:重构AI时代的存储新范式

    在人工智能与高性能计算需求呈指数级增长的今天,数据存储的效率与可靠性已成为释放的关键支撑。上海霄信息科技有限公司正式推出全新一代AI存储产品--霄
    的头像 发表于 08-21 10:36 1154次阅读
    霄<b class='flag-5'>云</b>科技银河存储:重构AI<b class='flag-5'>时代</b>的存储新<b class='flag-5'>范式</b>

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    北京2025年7月30日 /美通社/ -- 近日,北京积科技有限公司(以下简称"积科技")宣布其
    的头像 发表于 07-30 21:44 1136次阅读

    摩尔线程“AI工厂”:五大核心技术支撑,打造模型训练超级工厂

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进
    的头像 发表于 07-28 11:28 4952次阅读
    摩尔线程“AI工厂”:五大核心技术支撑,<b class='flag-5'>打造</b>大<b class='flag-5'>模型</b><b class='flag-5'>训练</b>超级工厂

    网络的“神经突触”:AI互联技术如何重构分布式训练范式

    过程中,由于单个AI芯片的提升速度无法跟上模型参数的增长速率,再加上庞大的模型参数和训练数据,已远远超出单个AI芯片甚至单台
    的头像 发表于 06-08 08:11 7895次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>网络的“神经突触”:AI互联技术如何重构分布式<b class='flag-5'>训练</b><b class='flag-5'>范式</b>