0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC23 | 阿里云机器学习平台 PAI 精选演讲推荐

NVIDIA英伟达 来源:未知 2023-03-19 22:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本次 GTC 大会,来自阿里云机器学习平台 PAI 的技术专家,将分享开源产品 DeepRec 的高性能 GPU 训练推理优化,以及机器学习模型中访存密集型计算 STITCH 融合优化技术

长按扫描下方二维码,或点击阅读原文,注册 GTC 并提前收藏阿里云机器学习平台 PAI 的精彩演讲。

0965371e-c663-11ed-bfe3-dac502259ad0.png

全球 AI 市场近年来保持了快速增长的趋势,根据市场研究机构 IDC 的数据显示,预计到 2025 年,全球 AI 市场规模将达到 1.25 万亿美元。同时,中国已成为全球最大的 AI 应用市场之一,据中国电子信息产业发展研究院发布的数据显示,截至 2022 年底,国内 AI 产业规模达到 1204 亿元人民币,同比增长 59.5%。

并且随着近阶段 AIGC(AI generated content)概念的爆火,人工智能再次受到全球社会层面的广泛关注。AIGC 能够带来更加创新的应用,包括坐席辅助、智能语音、自动驾驶、人脸识别、扩展现实、机器翻译以及金融欺诈检测等多个领域,潜力极大。

而在 AIGC 浪潮不断带来新惊喜的同时,今天 AI 开发门槛高仍然是亟待解决的问题。因硬件、框架和开发环境三者之间的适配度低,算法工程师们不得不关注底层基础设施的调优和适配工作,无形中降低了工作效率。

阿里云机器学习 PAI 团队致力于为企业和开发者们提供云原生、高性能的 AI 平台服务。在计算性能方面,专注于 AI 训练、AI 推理等方面的软硬协同优化工作,开源了丰富的工具套件。在平台能力方面,PAI 团队推出覆盖 AI 开发全链路的平台产品,兼容各类底层计算硬件和 AI 框架,让算法工程师们可以专注于 AI 开发的阶段,实现云、端侧、创新硬件等多种场景的创新。

以下为阿里云机器学习平台 PAI 在本次 GTC 大会的演讲简介:

阿里云机器学习平台 PAI 演讲推荐

DeepRec: 面向推荐场景的

高性能深度学习框架

会议代码:[S51544]

演讲时间:3 月 23 日 3:00 PM

演讲嘉宾:

098271b2-c663-11ed-bfe3-dac502259ad0.png

刘童璇,阿里巴巴高级技术专家

0b518cda-c663-11ed-bfe3-dac502259ad0.png

刘仕杰,NVIDIA GPU 计算专家团队工程师

演讲概要:

DeepRec 支持了淘宝搜索、猜你喜欢、定向、直通车等核心业务,支撑着千亿特征、万亿样本超大规模的搜索、推荐、广告场景的模型训练和推理。自 DeepRec 开源以来,已有数十家互联网公司将 DeepRec 应用在他们的搜推广场景的业务中,取得了显著的业务效果提升和性能提升。DeepRec 中提供的功能和性能优化主要分三个方面:1. 模型效果方面;2. 训练和推理优化方面;3. 模型部署方面。

本次演讲中,主要介绍 GPU 场景下,DeepRec 中多级 Embedding 混合存储功能,图感知的内存/显存分配器,SessionGroup 中多 CUDA Stream 支持,基于 NVIDIA Merlin HugeCTR SOK(Sparse Operation Kit)的 GPU 同步训练,以及Embedding 性能优化 Group Embedding。

您可以在 github 上体验 DeepRec:

https://github.com/alibaba/DeepRec

机器学习模型中访存

密集型计算 STITCH 融合优化技术

会议代码:[SE51289]

演讲时间:3 月 22 日2:00 PM

演讲嘉宾:

0d793724-c663-11ed-bfe3-dac502259ad0.png

郑桢,阿里巴巴高级技术专家

演讲概要:

近年来,访存密集型计算日益成为影响机器学习模型性能的重要因素。由于机器学习模型计算图日趋复杂,传统的机器学习编译器面对复杂的数据依赖关系时很难执行高效的计算融合优化。同时,动态张量形状(dynamic tensor shape)的模型优化需求开始兴起,缺失的张量形状使得访存密集型计算子图的性能优化变得更加困难。

本次演讲将讲述阿里巴巴针对机器学习任务中访存密集型计算性能优化的关键技术:STITCH 融合技术。该技术支持将任意类型及任何数量的机器学习访存密集型算子进行融合,最终将大粒度的访存密集型计算子图转化为单个的 GPU 核函数,以减少片外访存、框架调度及 GPU 核函数调用开销。

如何预约和注册

在 GTC 大会官网(https://www.nvidia.cn/gtc-global/)搜索会议代码找到该演讲,点击Add to Schedule”右上角五角星,提前预约或收藏。

如下图 [S51544] 演讲,点击“Add to Schedule”右上角五角星,即可添加至您的日程。

0daffac0-c663-11ed-bfe3-dac502259ad0.png

GTC 大会注册流程请参看 GTC23 注册教程,请在 3 月 26 日前完成在线注册,免费观看以及回看 GTC 2023 春季大会超过 650 场精彩内容!

扫描下方海报二维码,锁定 NVIDIA 创始人兼首席执行官黄仁勋的 GTC 主题演讲!北京时间 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中国重播。深度解读 NVIDIA 加速计算平台如何推动人工智能、元宇宙、云技术和可持续计算的下一波浪潮。加入 GTC23,切勿错过 AI 的决定性时刻!


原文标题:GTC23 | 阿里云机器学习平台 PAI 精选演讲推荐

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4039

    浏览量

    97642

原文标题:GTC23 | 阿里云机器学习平台 PAI 精选演讲推荐

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vision Board开发板使用paho_mqtt连接阿里失败是什么原因呢?

    mqtt_sample中添加阿里平台连接参数, 在下方的代码也进行了对应的修改 4.编译烧录,可以看到wifi模块初始化正常,并且进行联网 5.启动mqtt,然后就报错了,主要错误
    发表于 09-18 06:37

    阿里设备的物模型数据里面始终没有值是哪里的问题?

    如上图,不知道讲清楚没有。 IG502自定义TOPIC 上发到阿里没问题。采用阿里物模型的格式来上发就不行。请大佬指教!
    发表于 08-05 06:43

    替代自建物联平台的最优解?揭秘Tuya物联网平台阿里版的全托管力量

    诸多现实挑战。如何以更低成本、更短周期、更高效率构建面向未来的AIoT基础能力?涂鸦智能基于与阿里的深度合作,于去年9月重磅推出Tuya物联网平台阿里
    的头像 发表于 06-20 18:12 1379次阅读
    替代自建物联<b class='flag-5'>平台</b>的最优解?揭秘Tuya物联网<b class='flag-5'>平台</b><b class='flag-5'>阿里</b><b class='flag-5'>云</b>版的全托管力量

    商汤绝影王晓刚亮相NVIDIA GTC 2025并发表主题演讲

    商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚在NVIDIA GTC 2025发表演讲《激发通用人工智能的创造力,引领智能汽车走向全新的未来》。
    的头像 发表于 03-21 14:37 964次阅读

    NVIDIA GTC 2025精华一文读完 黄仁勋在GTC上的主题演讲

    AI 发展的人才和创意。对于创造新机会、新解决方案和新思维方式而言,GTC 无疑是绝佳选择。 在 GTC 大会,您可以了解最新新闻、聆听业内讨论、观看机器人演示,并思考变革行业的重大趋势。
    的头像 发表于 03-20 14:54 1713次阅读
    NVIDIA <b class='flag-5'>GTC</b> 2025精华一文读完 黄仁勋在<b class='flag-5'>GTC</b>上的主题<b class='flag-5'>演讲</b>

    黄仁勋GTC2025演讲:人工智能的终极形态物理AI将彻底改变世界

    3月19日凌晨,NVIDIA创始人兼首席执行官黄仁勋在2025年GTC开发者大会上发表了主题演讲演讲覆盖了AI科技演进以及计算需求,同时公布了英伟达的Blackwell架构最新一代产品、未来几代
    的头像 发表于 03-20 08:34 1487次阅读
    黄仁勋<b class='flag-5'>GTC</b>2025<b class='flag-5'>演讲</b>:人工智能的终极形态物理AI将彻底改变世界

    阿里是什么?企业不可不知的云端架构服务!

    阿里是什么?中国高速连线阿里 CDN 服务 阿里为国内云端市场中市占有率第一的
    的头像 发表于 03-16 09:43 1284次阅读

    阿里爆发式的跨越

    表示,阿里巴巴与苹果的合作,将不仅仅局限于手机服务领域,未来还将涉及更多的业务板块。 当媒体都在惊叹与讨论苹果为什么选择阿里巴巴时,背后真正的主角还需要加上一个 “” 字。 长期以来,相比淘宝、天猫、菜鸟,“
    的头像 发表于 03-12 16:54 610次阅读
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b>爆发式的跨越

    先进数通:阿里多项合作与上贵州供应商身份确认

    近日,有投资者就先进数通与阿里上贵州的合作情况提出询问。针对这些关注点,先进数通在互动平台上给出了明确回应。 先进数通确认,公司作为“金融核心先锋联盟”的首批20家成员之一,一直
    的头像 发表于 02-17 09:19 1195次阅读

    涂鸦智能深度合作阿里:打造更融合开放中立灵活的专属物联平台

    在2024年9月的云栖大会上,涂鸦智能与阿里联合发布了Tuya物联网平台阿里版。此产品一经问世,就获得了来自新能源、新制造、新零售、智慧
    的头像 发表于 02-10 18:12 1353次阅读
    涂鸦智能深度合作<b class='flag-5'>阿里</b><b class='flag-5'>云</b>:打造更融合开放中立灵活的专属物联<b class='flag-5'>平台</b>

    百度阿里上线DeepSeek模型部署服务

    。 与此同时,阿里也同步宣布,其PAI Model Gallery平台现已支持DeepSeek-V3和DeepSeek-R1的
    的头像 发表于 02-05 15:40 1165次阅读

    阿里官网电脑版,阿里电脑版的下载使用教程

        在计算蓬勃发展的时代,阿里作为行业的领军者,旗下的阿里官网电脑版为用户带来了功能强大且便捷的云端服务。它整合了
    的头像 发表于 01-23 14:49 1855次阅读
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b>官网电脑版,<b class='flag-5'>阿里</b><b class='flag-5'>云</b>电脑版的下载使用教程

    Tuya物联网平台阿里版:助力客户打造融合开放的专属物联平台

    在2024年9月的云栖大会上,涂鸦智能与阿里联合发布了Tuya物联网平台阿里版。此产品一经问世,就获得了来自新能源、新制造、新零售、智慧
    的头像 发表于 01-03 17:32 1106次阅读
    Tuya物联网<b class='flag-5'>平台</b><b class='flag-5'>阿里</b><b class='flag-5'>云</b>版:助力客户打造融合开放的专属物联<b class='flag-5'>平台</b>

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生
    的头像 发表于 12-25 11:54 695次阅读

    阿里代理有哪些?

    阿里作为全球领先的计算服务商,提供多种级别的代理商合作伙伴,以便更好地服务企业客户。不同级别的阿里代理商在服务、技术支持和返佣方面有显
    的头像 发表于 12-06 15:44 1311次阅读