0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为云 FunctionGraph 函数工作流—— “Serverless“遇见”AI,释放 AI 生产力

jf_81200783 来源:jf_81200783 作者:jf_81200783 2023-09-05 22:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5 月 26 日-27 日,由 msup 主办的 2023 年 A2M 峰会在上海南新雅皇冠假日酒店盛大举行。本次 A2M 峰会以“AIGC 时代下的 AI 落地实践、数据智能和基础架构演进”为主题,邀请了 100 余位行业专家从支撑数字化转型的几个关键技术切面入手,甄选前沿有典型代表的 84 个技术创新及研发实践的架构案例,分享他们本年度的总结和实践启示。

峰会第二日,华为云 Serverless 研发工程师朱安东带来了主题为“Serverless“遇见”AI,释放 AI 生产力”的分享,重点介绍了业界领先的基于函数计算的 ServerlessAI推理解决方案,并展示了华为云函数工作流(FunctionGraph)的灵活、速度,如何让开发人员提升工程效率,缩短 TTM 等。

wKgZomT3Pw-AAKThAALU486HbmE875.png

华为云serverless 研发工程师朱安东

朱安东表示:“AIGC 正逐渐在千行百业生根发芽,并且快速成为了行业中重要的生产力工具。伴随着 AIGC 大模型以及领域专家类型的中小模型的快速演进,引发了海量 AI 推理、大模型托管以及底层强大算力的诉求。然而,要想实现 AI 扎根千行百业、实现“AIeverywhere”的最终目标,我们仍然有很长的路要走。”

Serverless——AIeverywhere 的下一块拼图

从业内工程师的角度来看,AI 应用迭代发展的核心痛点主要包含 2 个方面:

第一:算法工程师作为 AI 应用的核心开发者通常只会和模型、数据以及代码打交道,主要工作围绕数据清洗、数据工程、特征工程还有模型设计、开发、训练等,偏研究和理论方向。但是一旦涉及到算法模型和 AI 应用的最终落地,推广给大量用户使用就会涉及到模型发布、上线等动作,为了完成这些流程,开发者通常需要去花时间和经历学习托管类知识,尤其是云原生时代下的 docker还有 k8s 等;

第二:对于参数量很大的模型上线后很难找到足量、优质的算力资源快速获得推理结果,推理性能差。从基础架构工程师的视角来看,GPU 硬件设备成本高,研究阶段的需求量尚且能够满足,但是上线后面对海量用户和请求的资源量过于庞大,需要大量的投入;

另外,业务通常都是有浮动趋势的,就像旅游业的淡季和旺季,为了满足业务峰值准备的资源在业务量低的时候资源利用率也随之降低,资源严重浪费。

综上,AI 应用如果想深入到人们的生活仍有很多问题需要克服。那么如何加速 AI 应用快速落地、敏捷迭代呢?Serverless 是以应用为中心的新型云原生计算形态,这是业界的共识。而“用户无感、按需使用、以应用为中心,无需关注基础设施”这几个特性正好可以解决 AI 应用的几个痛点问题:

第一:以应用为中心:AI 工程师可以专注业务逻辑和模型 performance,节约下大量的时间和精力。

第二:无需关注基础设施:企业和架构工程师无需提前准备海量计算资源、自建机房,只需按需使用,按量计费。

华为云 FunctionGraph 解决 AI 用户上云 4 大问题

华为云 FunctionGraph 函数工作流是一项基于事件驱动的函数托管计算服务,通过函数工作流,只需编写业务函数代码并设置运行的条件,无需配置和管理服务器等基础设施,函数便可以弹性、免运维、高可靠的方式运行。对于现阶段人们对业务、弹性以及降本增效等诉求提升,华为云 FunctionGraph 无疑是 AI 推理 Serverless 化的优质选项。

在 Serverless 的开发模式下,开发人员和交付流程实际上是有明显界限的。开发人员只需要上传代码包或者一个镜像文件即可让整个业务跑起来,不需要面对繁琐的交付流程。

wKgaomT3PxCAFqRcAAEH4_Xtbw0379.png

为了让用户能够在 Serverless 平台上更加丝滑、流畅的开发和运行 AI,华为云 FunctionGraph 推出了针对 AI 场景的解决方案,主要解决 AI 用户上云的四大问题:

①工程效率

模型开发、编排:专注业务代码,NoOps,低码编排

支持代码包,容器镜像

②性能、弹性:

长时负载,支持异步函数调用,最长函数执行时间 72 小时

冷启动问题:池化预热、弹性调度

③运行时、异构计算:

支持 GPU/NPU,加速推理性能

支持 GPU 共享,提升资源利用率

④模型加载加速:

大文件加载:OBS+SFS 结合,解决 ML 模型库 &模型自身大文件加载问题;

链路加速:高性能解压缩转换,降网络开销、CPU 解压耗时;共享内存加速技术,降解压 IO 开销;依赖包预加载,降低公共依赖的下载、解压耗时

同时华为云 FunctionGraph 基于函数计算的ServerlessAI推理解决方案具有 5 大优势:

1.更低的学习成本,更卓越的工程效率,更短的 TTM

华为云 FunctionGraph 可以极大提升开发效率。精通 Python 的算法科学家无需学习如何安装、配置和操作复杂的计算和数据存储基础设施,通过可视化拖拽式函数流便能编排复杂业务场景。此外,函数还支持容器镜像,简化了 AI 推理 Serverless 化。

2.丰富的函数开发生态。

华为云 FunctionGraph 支持 GPU/NPU 能力,具备 GPU 虚拟化技术,从而提高 GPU 硬件资源的利用率并降低使用成本。

3.更低的资源成本,按需付费,提供工作负载感知智能推荐能力。

函数计算以 1ms 粒度按量计费,函数编排基于节点执行次数计费

4.极致的冷启动、弹性及更智能的调度能力。

资源池化预热、分层预加载与弹性水位控制:通过单实例多并发、分层预热提升性能、降低成本。函数实例百毫秒冷启动时延,毫秒级弹性。

5.多维度结合的大文件加载加速能力。

高性能解压缩转换,降网络开销、CPU 解压耗时。

共享内存加速技术,降解压 IO 开销。

依赖包预加载,降低公共依赖的下载、解压耗时

wKgZomT3PxGAY_OAAAFEGu6UNAY320.png

Serverless 代表现代化架构的演进方向,与微服务将长期并存,在 5-10 年内将成为云的首要交付模式。根据 IDC 今天发布的《全球半年度公有云服务跟踪报告》显示,2020 年全球云计算市场同比增长 24.1%,收入总额达 3120 亿美元。同时 Serverless 对客户端还具有成本优化、效率提升的商业价值。面对 Serverless 的发展大势,华为云将打造全栈全场景的 Serverless 能力,并在音视频、数据处理、物联网、端测应用等场景优先推广落地,围绕这些场景进行打穿,推动相关高阶服务进行 Serverless 化改造。今年,华为云在能力打造上将优先推出函数计算 2.0、Serverless 应用托管CAE、事件网格服务 EventGrid、ADM 等;同时,也将在 Serverless 开发工具及可观测性上构建端到端的能力,并重点在前端 Trigger、后端 BaaS 上进行丰富,全面打造 Serverless 应用生态。华为云 FunctionGraph 期待与更多的开发者见面。

华为云持续将最先进的技术提供给全球的客户、伙伴和开发者,助力千行百业的客户商业成功。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42722

    浏览量

    303589
  • 华为云
    +关注

    关注

    3

    文章

    2844

    浏览量

    19433
  • AIGC
    +关注

    关注

    1

    文章

    397

    浏览量

    3308
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里QoderWork中国版推出AI生产力计划

    近日,阿里桌面智能体工作台**QoderWork CN**正式推出"AI生产力计划",即日起面向用户 **免费发放百亿积分** ,同时整合多款国产顶级大模型,打造面向办公场景的全栈AI
    的头像 发表于 06-05 10:58 735次阅读

    直播预告|玄铁 x Canonical:从本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨

    门槛,让高性能 RISC-V 真正成为 AI 开发者触手可及的生产力工具。 一场关于 RISC-V 如何从指令集走向 AI 基础设施底座的深度技术对话,诚邀芯片设计、系统软件及 AI
    发表于 05-15 12:15

    [完结15章]Java转 AI高薪领域必备-从0到1打通生产AI Agent开发

    现有的核心业务API(如订单查询、库存扣减)安全地暴露给大模型。同时,必须引入工作流引擎(如状态机或DAG有向无环图)来编排Agent的执行链路,解决大模型在多步推理中容易出现的“死循环”或“幻觉执行
    发表于 04-30 13:46

    曙光AI全栈平台解锁政企AI新效能

    AI风口席卷政企,能扎进实际场景的实战型AI才是政企刚需!行业空谈AI概念时,曙光AI全栈平台已将全栈自研技术,转化为政企可感知的真实
    的头像 发表于 04-07 15:29 555次阅读

    工作流节点说明---工作流节点

    平台提供工作流节点,实现工作流嵌套工作流的效果。 节点说明 在一个工作流中,开发者可以将另一个工作流作为其中的一个步骤或节点,实现复杂任务
    发表于 03-24 21:05

    工作流插件节点节点说明

    。 添加使用插件节点 在工作流画布下方单击添加节点,在弹出的节点面板中单击插件节点,并选择希望调用的插件。 配置插件节点 插件节点的输入和输出结构取决于工具定义的输入输出结构,不支持自定义设置。在插件
    发表于 03-23 16:54

    NVIDIA发布面向媒体工作流AI技术

    在 GTC 2026上,NVIDIA 宣布了多项强大的新技术,旨在变革直播媒体和后期制作工作流
    的头像 发表于 03-23 15:15 611次阅读

    工作流节点说明结束节点

    结束节点是工作流的最终节点,用于返回工作流运行后的结果。结束节点支持两种返回方式:返回变量、返回文本。 返回变量 在返回变量模式下,工作流运行结束后会以JSON格式输出所有返回参数,适用于工作
    发表于 03-16 16:43

    云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目

    日前,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目。根据项目规划,公司将基于自研国产AI推理加速卡,参与建设AI推理算集群,并
    的头像 发表于 03-14 09:04 911次阅读

    还在手动拼接 AI 代码?你的 IDE 早就该升级了

    进度,更可能因操作繁琐引发代码错误,直接影响工业控制系统的稳定性与安全性。传统IDE的AI应用模式,早已无法适配嵌入式开发的高效、高可靠需求。 我们真正需要的,是一款深度适配嵌入式开发、AI工作流内嵌
    发表于 03-11 10:25

    边缘AI临界点:深度解析176TOPS香橙派AI Station的产业价值

    ” 。 随着DeepSeek、LLaMA等开源模型的轻量化演进,以及具身智能、工业质检对实时性的严苛要求,AI计算正在从数据中心扩散到离数据源头最近的物理世界。在这一背景下,AI Mini Server(迷你
    发表于 03-10 14:19

    开发工作流创建工作流

    新建工作流 在小艺智能体平台页面,通过【工作空间】-【工作流】-【新建工作流】,进入新建工作流配置页面。设置
    发表于 03-10 10:05

    爱芯元智AI原生处理器释放智能生产力

    近年来,人工智能产业持续高速发展,大模型技术不断突破,为各行各业带来广阔的应用想象空间。与此同时,AI部署正从云端加速向边缘和终端延伸,边缘AI凭借其低延迟、高隐私和性价比等优势,成为推动
    的头像 发表于 09-10 11:42 1113次阅读
    爱芯元智<b class='flag-5'>AI</b>原生处理器<b class='flag-5'>释放</b>智能<b class='flag-5'>生产力</b>

    华为中国行2025山西新质生产力大会成功举办

    以“数智世界 太行有为”为主题的华为中国行2025·山西新质生产力大会在长治市成功举办。政府领导、行业大咖及业界专家齐聚一堂,旨在通过政府、企业与技术提供方的多方合作,推动产业数智化转型升级,释放数据价值,为长治数字经济发展提供
    的头像 发表于 09-10 10:33 1493次阅读

    “一句话秒出PPT“的荣耀YOYO,AI生产力有多强?

    释放AI生产力,荣耀让智能体告别发布会炫技
    的头像 发表于 07-14 14:15 2953次阅读
    “一句话秒出PPT“的荣耀YOYO,<b class='flag-5'>AI</b><b class='flag-5'>生产力</b>有多强?