0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

vLLM Meetup上海站成功举办

沐曦MetaX 来源:vLLM 2025-08-27 13:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:vLLM

2025年8月23日,vLLM Meetup上海站成功举办。活动汇聚技术专家、社区开发者及行业用户,围绕vLLM(一种用于大型语言模型的高性能推理引擎)的技术进展、生态建设及应用展开深度探讨。会议涵盖社区贡献指南、分布式推理架构、多模态模型集成等前沿议题,现场互动热烈,并提出每年举办vLLM Con大会的倡议,为AI推理领域的技术落地注入新动能。

本次Meetup由沐曦与红帽公司联合主办,红帽作为全球开源社区vLLM的重要贡献者,长期参与上游协作并分享实践经验,推动社区发展;沐曦则结合国产硬件优势,积极探索vLLM在本土计算平台上的适配与应用。沐曦开源生态总监章津楠与红帽亚太CTO办公室首席架构师张家驹共同开场,对到场嘉宾及观众表示欢迎。活动设置五大核心议题,并穿插开发者提问环节,最终以沐曦联合创始人、CTO兼首席软件架构师杨建博士的开源生态趋势分享及书籍签赠环节收尾,现场气氛活跃。

活动核心环节围绕五大技术方向展开,专家团队通过案例解析与方案演示,系统呈现vLLM在社区生态、分布式架构、多模态集成等领域的创新实践。

在题为《vLLM: Building, Testing and Contributing》演讲中, vLLM社区贡献者、Red Hat资深专家Daniele Trifirò深入剖析了vLLM社区的发展现状,为爱好者及开发者提供了系统性指南。他详细阐述了项目构建流程、关键测试规范,并指导开发者如何高效贡献代码。通过丰富的代码实例、实践案例及参考链接,演讲极大降低了初学者入门门槛,获得现场开发者高度认可。

在《Disaggregated P/D for Wide EP》主题分享中,vLLM社区贡献者、Red Hat技术专家Nicolò Lucchesi重点介绍了利用llm-d实现vLLM分布式推理的方案,核心目标是通过预填充/解码(P/D)解耦与宽专家并行(EP)扩展大模型推理能力,尤其针对长上下文和混合专家(MoE)模型场景,关键技术方案包括P/D解耦部署、通过NIXL实现高效KV Cache传输、支持预填充(P)与解码(D)阶段采用不同TP并行度、将MoE模型中的专家分布至不同GPU等实现细节。

百度高级产品经理王凯在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演讲中,系统解析了百度ERNIE 4.5多模态模型与vLLM的集成实践。内容涵盖ERNIE 4.5 的特性、与 vLLM 集成的原因以及 vLLM 为 ERNIE 4.5 模型提供的全面支持,包括密集模型、MoE 模型和用于加速生成的MTP。同时还介绍了正在进行的开发工作,例如专家并行性负载均衡和视觉-语言支持。

Mooncake核心开发者苏金阳在《Mooncake x LMCache 性能优化分享》的主题分享中重点介绍了 Mooncake(特别是其传输引擎和存储)与 LMCache 的集成,以在 vLLM 中实现高性能 KV Cache 重用。LMCache 被认为是用于 KV Cache 管理(卸载、重用、P/D 分离、RAG 缓存)的流行 vLLM 社区扩展。此次集成旨在提高数据分发效率和整体系统性能。

沐曦vLLM推理引擎专家张廉洁在《vLLM-metax: Bridging CUDA to MetaX MACA》演讲中,详细介绍了vLLM-metax 如何通过 cu-bridge 在 MACA 上实现接近零成本的 CUDA 执行,允许在不修改源代码的情况下进行原生编译。同时还解释了在 vLLM 中使用插件架构支持 MetaX 的方式,概述了修补方法(patch补丁和文件替换)和限制。演讲还公布了2025年路线图。

提问环节中,开发者围绕社区贡献规范、分布式推理落地、国产硬件支持等议题提出建议,嘉宾以技术细节回应,讨论贯穿全场。

本次活动彩蛋,沐曦联合创始人、CTO兼首席软件架构师杨建博士惊喜亮相现场,他不仅生动分享了沐曦在开源生态和vLLM推理技术的最新趋势,还热情地为获得《沐曦异构并行计算软件栈》书籍的幸运观众亲笔签名留念。

本次Meetup不仅展示了vLLM在分布式推理、多模态集成及硬件适配领域的最新成果,更通过技术交流与生态合作,为AI推理引擎的规模化应用提供了实践范本。行业专家与开发者的深度互动,进一步强化了vLLM在开源社区的技术影响力,为下一代AI基础设施的研发奠定基础。

关于沐曦

沐曦致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53530

    浏览量

    458867
  • 开源
    +关注

    关注

    3

    文章

    4031

    浏览量

    45551
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51694

原文标题:vLLM Meetup上海站圆满落幕

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025开放原子校源行上海成功举办

    10月15日,开放原子校源行(上海)在复旦大学成功举办。本次活动作为复旦大学计算机建系50周年系列活动之一,邀请院士专家、高校领导、知名开源社区代表、头部科技企业代表以及来自复旦大学
    的头像 发表于 10-17 11:01 444次阅读

    2025 NVIDIA创业企业展示北京成功举办

    近日,2025 NVIDIA 创业企业展示——北京(AI 智能体与物理 AI 出海专场)在北京量子银座集智会议中心举办
    的头像 发表于 09-16 10:43 916次阅读

    汇川技术汇英行动人才双选日苏州成功举办

    金秋九月,汇聚英才。 汇英行动人才双选日·苏州于9月6日在汇川技术苏州总部大厦成功举办
    的头像 发表于 09-11 17:12 1077次阅读

    2025紫光同创FPGA技术研讨会成都成功举办

    近日,“2025紫光同创FPGA技术研讨会”成都成功举办,来自通信、工业、图像视频、消费、汽车等领域近200名专业观众参会交流,现场座无虚席,气氛热烈。自此,本年度紫光同创线下研讨会系列活动圆满收官!
    的头像 发表于 09-08 17:26 962次阅读

    格罗方德2025年度技术峰会北美成功举办

    格罗方德2025年度技术峰会(GlobalFoundries Technology Summit 2025, GTS 2025)北美于8月28日在美国加利福尼亚州圣克拉拉市成功举办
    的头像 发表于 09-03 17:29 765次阅读

    开放原子园区行重庆成功举办

    8月29日,开放原子“园区行”(重庆)在渝州宾馆成功举办,活动以“共建智能汽车操作系统开源生态”为主题,汇聚政府机构、高校及科研院所、OEM厂商、汽车软件开发企业、芯片企业、开源社区的近100位代表,共探开源模式如何破解智能汽
    的头像 发表于 09-01 18:10 891次阅读

    2025开放原子园区行上海成功举办

    近日,以“开源赋能智能,协同创新共筑AI未来”为主题的开放原子“园区行”(上海)在上海市徐汇区成功举办。本次活动由开放原子开源基金会与
    的头像 发表于 07-07 18:12 825次阅读

    2025开放原子校源行广东海洋大学活动成功举办

    近日,由开放原子开源基金会主办,广东海洋大学和北京中软国际教育科技股份有限公司承办的“开放原子校源行”(广东海洋大学)活动成功举办
    的头像 发表于 06-30 10:02 588次阅读

    2025开放原子校源行太原成功举办

    近日,开放原子“校源行”(太原)在中北大学成功举办。工业和信息化部信息技术发展司、山西省工信厅、山西省教育厅,以及地方工信部门、高校、头部科技企业代表等600余人共话开源生态,推进开源教育。
    的头像 发表于 06-28 17:44 1039次阅读

    Wolfspeed助力捷豹TCS车队FE上海成功卫冕

    !从第一回合遭遇低谷,到第二回合成功卫冕,捷豹 TCS 车队逆风翻盘!“KIWI”组合上海两年两冠,续写传奇!
    的头像 发表于 06-06 09:12 681次阅读

    2025年开放原子校源行清华大学成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校源行”(清华)在清华大学成功举办
    的头像 发表于 04-22 16:46 751次阅读

    开放原子园区行太原成功举办

    近日,由开放原子开源基金会、山西省工业和信息化厅、山西转型综合改革示范区管委会联合主办的开放原子“园区行”(太原)活动在太原市同昌创业园成功举办
    的头像 发表于 04-02 16:54 777次阅读

    2025芯来RISC-V技术研讨会苏州成功举办

    近日,2025芯来RISC-V技术研讨会@苏州活动成功举办。此次苏州研讨由芯来科技与劳特巴赫中国联合主办,同时也感谢上海开放处理器产业创
    的头像 发表于 03-26 11:50 1044次阅读

    索尼新品品鉴会上海成功举办

    近日,索尼携手《家庭影院技术》杂志成功举办了“把影院带回家,索尼家用投影P9(VPL-XW8100)新品品鉴会”全国巡展的上海。来自华东地区众多行业人士和影音爱好者,共同见证了索尼“
    的头像 发表于 12-19 15:20 879次阅读

    vLLM项目加入PyTorch生态系统,引领LLM推理新纪元

    近日,vLLM项目宣布正式成为PyTorch生态系统的一部分,标志着该项目与PyTorch的合作进入了一个全新的阶段。本文将从以下几个方面进行介绍,特别提醒:安装方案在第四个部分,可选择性阅读
    的头像 发表于 12-18 17:06 1565次阅读
    <b class='flag-5'>vLLM</b>项目加入PyTorch生态系统,引领LLM推理新纪元