0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CNCC | 论坛:探索 AI 全栈解决方案和基于 LLM 的推理与部署实践

NVIDIA英伟达 来源:未知 2023-10-24 10:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023 年中国计算机大会(CNCC2023)以“发展数字基础设施,支撑数字中国建设”为主题,将于 10 月 26 - 28 日在沈阳新世界博览馆举办。

NVIDIA 携手合作伙伴丽台科技受邀为大会带来三大技术论坛,并在展位开设持续两天的开发者小课堂,为计算机行业的学者、研究人员、开发者和高校的同学们带来 NVIDIA 的最新技术应用实践。欢迎莅临我们的展位(沈阳新世界博览馆 4 楼 C 展馆 T13),与我们一起探索 AI加速计算的未来,开启生成式 AI 新时代!

NVIDIA 在 CNCC2023 的活动概览:

时间

主题

地点

10 月 26 日

13:30 - 17:30

NVIDIA AI 全栈技术解决方案研讨会

沈阳皇朝万鑫酒店

8 层 - 16

10 月 27 日

13:30 - 17:30

基于超大模型的推理和部署实践

沈阳新世界博览馆

5 层会议室 503

10 月 28 日

13:30 - 17:30

探索 Omniverse和AI加速创作开发流程

沈阳皇朝万鑫酒店

8 层 - 19

10 月 26 日

– 27 日

开发者小课堂

沈阳新世界博览馆

4 楼 C 展馆 T13

10 月 26 – 27 日,NVIDIA 将举办两场技术论坛:NVIDIA AI 全栈技术解决方案研讨会和基于超大模型的推理和部署实践分论坛,我们将分享 AI 领域最新的发展趋势,探讨大语言模型的崛起如何为 AI 技术的应用开拓新领域。

论坛详情

NVIDIA AI 全栈技术解决方案研讨会

时间:10 月 26 日 13:30 - 17:30

地点:沈阳皇朝万鑫酒店 8 层 - 16

AI 正迎来有史以来最辉煌的时刻,新的 AI 技术和迅速发展的应用正在改变各行各业。从自主机器人开发、自动驾驶系统和软件、GPU 加速的大语言模型以及火热的生成式 AI 背后的智能网络技术。在 NVIDIA AI 全栈技术解决方案论坛,NVIDIA 专家将为您揭示 AI 技术新趋势。

+

+

具体议程

面向生成式 AI 的端到端高性能网络关键技术

演讲时间:13:35 - 14:20

演讲简介:分享 Spectrum-X 平台技术创新及其在 AI Cloud 行业的应用介绍 Quantum 平台及网络计算技术对大规模生成式 AI 应用的加速。

-------------------------

wKgZomU3LVmAY53IAAAt4J-yd80838.jpg

冯高锋

NVIDIA HPC-AI 技术市场高级总监

构建 LLM 大规模训练推理基础架构的最佳实践(网络篇)

演讲时间:14:20 - 15:05

演讲简介:以当前火热的大语言模型(LLM)生成式人工智能为切入点,探索其成功背后的全栈智能网络技术,并介绍 NVIDIA BlueField-3 DPU 和 NVIDIA DOCA 2.0 为加速计算提供高性能、高效率和高安全性的云计算基础设施。

-------------------------

wKgZomU3LVmAERMgAAAOztQ4g4s744.jpg

王淼

NVIDIA 解决方案总监

NVIDIA 互联网行业 Infra 方向技术负责人

构建 LLM 大规模训练推理基础架构的最佳实践(GPU 篇)

演讲时间:15:05 - 15:50

演讲简介:介绍 NVIDIA 在 LLM 训练和推理场景的基础架构层面的最佳产品和方案。NVIDIA DGX SuperPOD 架构是实现 LLM 训练的最高性能基础架构,由 NVIDIA 实现全栈交付,极致满足客户算力需求。同时,NVIDIA Hopper NVL 产品可灵活适配主流服务器,在 LLM 推理场景帮助客户实现更高收益。

-------------------------

wKgZomU3LVmAJmh1AAA8y-OPnN0275.jpg

艾静

NVIDIA 解决方案架构师

市场高级总监

NVIDIA 加速边缘计算和自主机器开发

演讲时间:15:50 - 16:35

演讲简介:智能机器人和边缘计算是现在人工智能的一个热点,NVIDIA 提供软硬件全栈解决方案,从仿真开发到部署,助力边缘计算和智能机器人应用的实现。同时,丰富强大的生态帮助开发者和用户加速开发过程,轻松应对全行业应用。

-------------------------

wKgZomU3LVqAKuGJAAAqAq-NnYc657.jpg

李雨倩

NVIDIA 开发者关系总监

NVIDIA 全栈加速自动驾驶开发

演讲时间:16:35 - 17:20

演讲简介:围绕着自动驾驶整个数据闭环开发,NVIDIA 提供全栈的解决方案,从硬件、系统到软件,从数据中心到车端,助力自动驾驶高效开发、快速迭代。

-------------------------

wKgZomU3LVqAKcf_AAA8V_d81Pk744.jpg

程帅

NVIDIA 解决方案架构师

基于超大模型的推理和部署实践分论坛

时间:10 月 27 日 13:30 - 17:30

地点:沈阳新世界博览馆5层会议室503

大语言模型的兴起为 AI 技术的应用开辟了更广阔的空间,越来越多研究和实践证明超大模型在各类任务上的卓越能力与重要性。在 CNCC2023 大会上,腾讯、百度和阿里云将携手 NVIDIA 带来《基于超大模型的推理和部署实践》论坛。

通过本次论坛,您将了解到腾讯的生成式 AI 如何高效地部署;百度飞桨在 LLM 分布式训练方面的最新技术;阿里云 PAI 大语言模型推理服务实践;NVIDIA 在 GPU LLM 训练与推理部署优化解决方案以及构建 LLM 大规模训练推理基础架构的最佳实践分享。

+

+

具体议程

生成式 AI 高效部署实践

演讲时间:13:35 - 14:20

演讲简介:自 OpenAI 推出 ChatGPT 后,市场反应强烈。国内外科技公司快速跟进,到今年三月份,各公司逐步推出其专属的 ChatGPT 版本,并基于此开发逐步研发相关的商业应用。而 GPT 超大的模型结构在部署时产生的高延迟,高成本是其商业化路上的最大障碍。我们将从小型化算法、推理框架及服务化部署等多个方面和大家分享工业级 GPT 高效部署优化方案。

-------------------------

wKgZomU3LVqAJTRzAAAcHutI8Zo633.jpg

刘凯

腾讯高级工程师

基于飞桨的 LLM 训练和应用实践

演讲时间:14:20 - 15:05

演讲简介:介绍飞桨在 LLM 分布式训练方面的最新技术,针对 LLM 的开发、训练、Tuning、推理全流程工具设计,以及实际大规模训练和部署的应用实践。

-------------------------

wKgZomU3LVqAQ-7zAAA-6r81wxQ560.jpg

曾锦乐

百度资深工程师

GPU LLM 训练与推理部署优化实践与解决方案

演讲时间:15:05 - 15:50

演讲简介:介绍大语言模型训练推理中常用的优化支持和技巧(数据并行、Tensor 并行、Pipline 并行、Sequence并行、selective activation recompute、NCCL、TRTLLM 等)以及 Nemo framework 的全链路支持方案。

-------------------------

wKgZomU3LVqAKlOrAABHQ_A69O4004.jpg

高慧怡

NVIDIA 解决方案架构师

阿里云 PAI 大语言模型推理服务实践

演讲时间:15:50 - 16:35

演讲简介:大语言模型的兴起为人工智能技术的应用开辟了更广阔的空间。然而,大语言模型的训练和推理都需要大量的计算资源和时间,因此,性能和成本是大语言模型普及路上的重要挑战。演讲将主要介绍阿里云 PAI 平台为了应对这一挑战所做的工作,包括:

1)如何基于推理加速技术在 GPU 特别是 NVIDIA 平台上实现了大语言模型推理的高效推理;

2)如何利用云平台天然的弹性特性,通过资源调度降低用户的成本;

3)如何在保证性能和成本的前提下保持灵活性,支持社区百花齐放的大语言模型。

-------------------------

wKgZomU3LVuAMfNKAAB7CSwC6yM384.jpg

邱侠斐

阿里云机器学习平台(PAI)系统优化团队负责人

构建 LLM 大规模训练推理基础架构的最佳实践(基础架构篇)

演讲时间:16:35 - 17:20

演讲简介:介绍 NVIDIA 在 LLM 训练和推理场景的基础架构层面的最佳产品和方案。NVIDIA DGX SuperPOD 架构是实现 LLM 训练的最高性能基础架构,由 NVIDIA 实现全栈交付,极致满足客户算力需求。同时,NVIDIA Hopper NVL 产品可灵活适配主流服务器,在 LLM 推理场景帮助客户实现更高收益。

-------------------------

wKgZomU3LVmAJmh1AAA8y-OPnN0275.jpg

艾静

NVIDIA 解决方案架构师

内容分享后更有问答交流环节,现场专家阵容将悉心为您答疑解惑!

报名参会

扫描下方二维码,即刻报名参与论坛。

期待您莅临现场,一起领略更多精彩!

wKgZomU3LVuAIcWZAABRwoeGjGE484.jpg

您可以从CNCC2023 | 开启生成式 AI 新时代!NVIDIA 多场论坛下周重磅登场全面了解 NVIDIA 在 CNCC 的活动概览。

后续我们还将为您呈现关于探索 Omniverse 和 AI 加速创作开发流程论坛的详细信息,请持续关注我们。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,关注更多会议及活动信息。

wKgZomU3LVuAR-wKAAFtccdApf0933.jpg


原文标题:CNCC | 论坛:探索 AI 全栈解决方案和基于 LLM 的推理与部署实践

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97688

原文标题:CNCC | 论坛:探索 AI 全栈解决方案和基于 LLM 的推理与部署实践

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA TensorRT LLM 1.0推理框架正式上线

    TensorRT LLM 作为 NVIDIA 为大规模 LLM 推理打造的推理框架,核心目标是突破 NVIDIA 平台上的推理性能瓶颈。为实
    的头像 发表于 10-21 11:04 770次阅读

    科士达解决方案亮相2025 ODCC,驱动绿色AI智算基础设施革新

    全球顶尖企业、技术专家与行业领袖,共同探索数据中心在智算时代的技术路径与生态协同。科士达携高可靠解决方案亮相ODCC,展示其对下一代绿色智算基础设施的系统性思
    的头像 发表于 09-17 15:40 860次阅读
    科士达<b class='flag-5'>全</b><b class='flag-5'>栈</b><b class='flag-5'>解决方案</b>亮相2025 ODCC,驱动绿色<b class='flag-5'>AI</b>智算基础设施革新

    米尔RK3576部署端侧多模态多轮对话,6TOPS算力驱动30亿参数LLM

    通过硬件算力优化与软件协同,将视觉编码、语言推理、对话管理三大核心能力封装为可落地的工程方案,而本文将聚焦其多轮对话的部署流程,拆解从
    发表于 09-05 17:25

    华为亮相2025金融AI推理应用落地与发展论坛

    近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,
    的头像 发表于 08-15 09:45 958次阅读

    黑芝麻智能AI机器人计算平台荣膺国际大奖

    黑芝麻智能AI机器人计算平台荣膺新加坡年度"GO! Technology Utilisation Winner",作为面向新一代机器人实时AI
    的头像 发表于 08-07 17:35 1737次阅读

    高达2070TFLOPS算力|腾视科技基于NVIDIA Jetson Thor系列模组,重磅推出AI边缘智算大脑解决方案

    探索物理AI的无限可能。无论是硬件厂商、软件开发者,还是各行业的应用企业,让我们携手共进,利用腾视科技先进的AI边缘智算大脑
    的头像 发表于 07-28 18:09 1092次阅读
    高达2070TFLOPS算力|腾视科技基于NVIDIA Jetson Thor系列模组,重磅推出<b class='flag-5'>全</b><b class='flag-5'>栈</b><b class='flag-5'>AI</b>边缘智算大脑<b class='flag-5'>解决方案</b>

    高达2070TFLOPS算力|腾视科技基于NVIDIA Jetson Thor系列模组,重磅推出AI边缘智算大脑解决方案

    探索物理AI的无限可能。无论是硬件厂商、软件开发者,还是各行业的应用企业,让我们携手共进,利用腾视科技先进的AI边缘智算大脑
    的头像 发表于 07-28 16:48 1338次阅读
    高达2070TFLOPS算力|腾视科技基于NVIDIA Jetson Thor系列模组,重磅推出<b class='flag-5'>全</b><b class='flag-5'>栈</b><b class='flag-5'>AI</b>边缘智算大脑<b class='flag-5'>解决方案</b>

    高达2070TFLOPS算力腾视科技基于NVIDIA Jetson Thor系列模组,重磅推出AI边缘智算大脑解决方案

    探索物理AI的无限可能。无论是硬件厂商、软件开发者,还是各行业的应用企业,让我们携手共进,利用腾视科技先进的AI边缘智算大脑
    的头像 发表于 07-28 16:45 631次阅读
    高达2070TFLOPS算力腾视科技基于NVIDIA Jetson Thor系列模组,重磅推出<b class='flag-5'>全</b><b class='flag-5'>栈</b><b class='flag-5'>AI</b>边缘智算大脑<b class='flag-5'>解决方案</b>

    AI应用创新与技术融合分论坛即将召开

    2025开放原子开源生态大会即将启幕,其中 “AI应用创新与技术融合分论坛”将于 7月24日重磅亮相。论坛聚焦人工智能技术与开源生态的深
    的头像 发表于 07-23 09:54 717次阅读

    如何在魔搭社区使用TensorRT-LLM加速优化Qwen3系列模型推理部署

    TensorRT-LLM 作为 NVIDIA 专为 LLM 推理部署加速优化的开源库,可帮助开发者快速利用最新 LLM 完成应用原型验证与产
    的头像 发表于 07-04 14:38 1760次阅读

    移远通信携手高通:以车载解决方案,共绘智能出行新蓝图

    通信携车载智能解决方案深度参与峰会。移远通信汽车前装事业部总经理王敏在主论坛发表主题演讲,分享AI大模型驱动座舱智能化跃迁的
    的头像 发表于 06-27 20:35 779次阅读
    移远通信携手高通:以<b class='flag-5'>全</b><b class='flag-5'>栈</b>车载<b class='flag-5'>解决方案</b>,共绘智能出行新蓝图

    基于RAKsmart云服务器的AI大模型实时推理方案设计

    面对高并发请求、严格的响应延迟要求及波动的业务负载,传统本地化部署的算力瓶颈愈发显著。RAKsmart云服务器凭借其弹性计算资源池、分布式网络架构与AI加速能力,为
    的头像 发表于 05-13 10:33 467次阅读

    中软国际携手华为推出政务AI解决方案

    近日,在华为中国合作伙伴大会2025的“数智赋能城市全域数字化转型“主题论坛上,中软国际副总裁、AIGC研究院院长万如意博士以《昇腾算力x政务智囊团—政务AI
    的头像 发表于 03-24 17:30 1229次阅读

    AI Agent 应用与项目实战》阅读心得3——RAG架构与部署本地知识库

    的相似度搜索算法;响应生成器则负责将检索结果整合到提示模板中,调用LLM生成最终答案。在此再提一下云端部署方案,可以分析使用API Key调用云端LLM的优势和注意事项。这种
    发表于 03-07 19:49

    新品| LLM630 Compute Kit,AI 大语言模型推理开发平台

    LLM630LLM推理,视觉识别,可开发,灵活扩展···LLM630ComputeKit是一款AI大语言模型推理开发平台,专为边缘计算和智能
    的头像 发表于 01-17 18:48 1206次阅读
    新品| <b class='flag-5'>LLM</b>630 Compute Kit,<b class='flag-5'>AI</b> 大语言模型<b class='flag-5'>推理</b>开发平台