0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

vLLM Meetup上海站成功举办

沐曦MetaX 来源:vLLM 2025-08-27 13:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:vLLM

2025年8月23日,vLLM Meetup上海站成功举办。活动汇聚技术专家、社区开发者及行业用户,围绕vLLM(一种用于大型语言模型的高性能推理引擎)的技术进展、生态建设及应用展开深度探讨。会议涵盖社区贡献指南、分布式推理架构、多模态模型集成等前沿议题,现场互动热烈,并提出每年举办vLLM Con大会的倡议,为AI推理领域的技术落地注入新动能。

本次Meetup由沐曦与红帽公司联合主办,红帽作为全球开源社区vLLM的重要贡献者,长期参与上游协作并分享实践经验,推动社区发展;沐曦则结合国产硬件优势,积极探索vLLM在本土计算平台上的适配与应用。沐曦开源生态总监章津楠与红帽亚太CTO办公室首席架构师张家驹共同开场,对到场嘉宾及观众表示欢迎。活动设置五大核心议题,并穿插开发者提问环节,最终以沐曦联合创始人、CTO兼首席软件架构师杨建博士的开源生态趋势分享及书籍签赠环节收尾,现场气氛活跃。

活动核心环节围绕五大技术方向展开,专家团队通过案例解析与方案演示,系统呈现vLLM在社区生态、分布式架构、多模态集成等领域的创新实践。

在题为《vLLM: Building, Testing and Contributing》演讲中, vLLM社区贡献者、Red Hat资深专家Daniele Trifirò深入剖析了vLLM社区的发展现状,为爱好者及开发者提供了系统性指南。他详细阐述了项目构建流程、关键测试规范,并指导开发者如何高效贡献代码。通过丰富的代码实例、实践案例及参考链接,演讲极大降低了初学者入门门槛,获得现场开发者高度认可。

在《Disaggregated P/D for Wide EP》主题分享中,vLLM社区贡献者、Red Hat技术专家Nicolò Lucchesi重点介绍了利用llm-d实现vLLM分布式推理的方案,核心目标是通过预填充/解码(P/D)解耦与宽专家并行(EP)扩展大模型推理能力,尤其针对长上下文和混合专家(MoE)模型场景,关键技术方案包括P/D解耦部署、通过NIXL实现高效KV Cache传输、支持预填充(P)与解码(D)阶段采用不同TP并行度、将MoE模型中的专家分布至不同GPU等实现细节。

百度高级产品经理王凯在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演讲中,系统解析了百度ERNIE 4.5多模态模型与vLLM的集成实践。内容涵盖ERNIE 4.5 的特性、与 vLLM 集成的原因以及 vLLM 为 ERNIE 4.5 模型提供的全面支持,包括密集模型、MoE 模型和用于加速生成的MTP。同时还介绍了正在进行的开发工作,例如专家并行性负载均衡和视觉-语言支持。

Mooncake核心开发者苏金阳在《Mooncake x LMCache 性能优化分享》的主题分享中重点介绍了 Mooncake(特别是其传输引擎和存储)与 LMCache 的集成,以在 vLLM 中实现高性能 KV Cache 重用。LMCache 被认为是用于 KV Cache 管理(卸载、重用、P/D 分离、RAG 缓存)的流行 vLLM 社区扩展。此次集成旨在提高数据分发效率和整体系统性能。

沐曦vLLM推理引擎专家张廉洁在《vLLM-metax: Bridging CUDA to MetaX MACA》演讲中,详细介绍了vLLM-metax 如何通过 cu-bridge 在 MACA 上实现接近零成本的 CUDA 执行,允许在不修改源代码的情况下进行原生编译。同时还解释了在 vLLM 中使用插件架构支持 MetaX 的方式,概述了修补方法(patch补丁和文件替换)和限制。演讲还公布了2025年路线图。

提问环节中,开发者围绕社区贡献规范、分布式推理落地、国产硬件支持等议题提出建议,嘉宾以技术细节回应,讨论贯穿全场。

本次活动彩蛋,沐曦联合创始人、CTO兼首席软件架构师杨建博士惊喜亮相现场,他不仅生动分享了沐曦在开源生态和vLLM推理技术的最新趋势,还热情地为获得《沐曦异构并行计算软件栈》书籍的幸运观众亲笔签名留念。

本次Meetup不仅展示了vLLM在分布式推理、多模态集成及硬件适配领域的最新成果,更通过技术交流与生态合作,为AI推理引擎的规模化应用提供了实践范本。行业专家与开发者的深度互动,进一步强化了vLLM在开源社区的技术影响力,为下一代AI基础设施的研发奠定基础。

关于沐曦

沐曦致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54379

    浏览量

    469004
  • 开源
    +关注

    关注

    3

    文章

    4325

    浏览量

    46427
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253

原文标题:vLLM Meetup上海站圆满落幕

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电科网安2025安全保密应用交流系列活动郑州成功举办

    初冬中原,智慧汇聚。12月11日,电科网安“创新驱动保密 共筑安全防线”2025安全保密应用交流系列活动郑州成功举办,为中原地区重点行业单位嘉宾献上了一场精彩纷呈的安全保密技术盛会。
    的头像 发表于 12-19 17:26 1685次阅读

    2025开放原子园区行宁波成功举办

    12月5日,以“开源甬动 产业跃升”为主题的开放原子“园区行”(宁波)在宁波广电集团第二演播厅成功举办。活动搭建起开源项目与本地场景需求的精准对接平台,为宁波产业数字化升级注入强劲动力,推动开源
    的头像 发表于 12-12 16:18 887次阅读

    开源鸿蒙城市技术沙龙上海圆满落幕

    11月25日,由开源鸿蒙项目管理委员会(PMC)与合规SIG联合主办、模速空间科创金融综合服务平台承办的“开源鸿蒙城市技术沙龙·上海”暨“开源鸿蒙合规SIG年度 Meetup”在上海
    的头像 发表于 12-03 17:36 1435次阅读

    2025开放原子校源行上海成功举办

    10月15日,开放原子校源行(上海)在复旦大学成功举办。本次活动作为复旦大学计算机建系50周年系列活动之一,邀请院士专家、高校领导、知名开源社区代表、头部科技企业代表以及来自复旦大学
    的头像 发表于 10-17 11:01 731次阅读

    AGIROS开源社区Meetup上海圆满落幕,RT-Thread睿赛德分享核心技术赋能机器人开发|新闻速递

    2025年9月20日,AGIROS开源社区Meetup上海顺利举办。RT-Thread睿赛德AI负责人叶昌博士受邀出席,带来“从异构通信到虚拟化技术:RT-Thread助力机器人敏捷、可持续开发
    的头像 发表于 09-22 21:25 825次阅读
    AGIROS开源社区<b class='flag-5'>Meetup</b><b class='flag-5'>上海</b><b class='flag-5'>站</b>圆满落幕,RT-Thread睿赛德分享核心技术赋能机器人开发|新闻速递

    2025 NVIDIA创业企业展示北京成功举办

    近日,2025 NVIDIA 创业企业展示——北京(AI 智能体与物理 AI 出海专场)在北京量子银座集智会议中心举办
    的头像 发表于 09-16 10:43 1300次阅读

    汇川技术汇英行动人才双选日苏州成功举办

    金秋九月,汇聚英才。 汇英行动人才双选日·苏州于9月6日在汇川技术苏州总部大厦成功举办
    的头像 发表于 09-11 17:12 1527次阅读

    2025紫光同创FPGA技术研讨会成都成功举办

    近日,“2025紫光同创FPGA技术研讨会”成都成功举办,来自通信、工业、图像视频、消费、汽车等领域近200名专业观众参会交流,现场座无虚席,气氛热烈。自此,本年度紫光同创线下研讨会系列活动圆满收官!
    的头像 发表于 09-08 17:26 1523次阅读

    格罗方德2025年度技术峰会北美成功举办

    格罗方德2025年度技术峰会(GlobalFoundries Technology Summit 2025, GTS 2025)北美于8月28日在美国加利福尼亚州圣克拉拉市成功举办
    的头像 发表于 09-03 17:29 1196次阅读

    开放原子园区行重庆成功举办

    8月29日,开放原子“园区行”(重庆)在渝州宾馆成功举办,活动以“共建智能汽车操作系统开源生态”为主题,汇聚政府机构、高校及科研院所、OEM厂商、汽车软件开发企业、芯片企业、开源社区的近100位代表,共探开源模式如何破解智能汽
    的头像 发表于 09-01 18:10 1187次阅读

    2025开放原子园区行上海成功举办

    近日,以“开源赋能智能,协同创新共筑AI未来”为主题的开放原子“园区行”(上海)在上海市徐汇区成功举办。本次活动由开放原子开源基金会与
    的头像 发表于 07-07 18:12 1100次阅读

    2025开放原子校源行广东海洋大学活动成功举办

    近日,由开放原子开源基金会主办,广东海洋大学和北京中软国际教育科技股份有限公司承办的“开放原子校源行”(广东海洋大学)活动成功举办
    的头像 发表于 06-30 10:02 870次阅读

    2025开放原子校源行太原成功举办

    近日,开放原子“校源行”(太原)在中北大学成功举办。工业和信息化部信息技术发展司、山西省工信厅、山西省教育厅,以及地方工信部门、高校、头部科技企业代表等600余人共话开源生态,推进开源教育。
    的头像 发表于 06-28 17:44 1312次阅读

    Wolfspeed助力捷豹TCS车队FE上海成功卫冕

    !从第一回合遭遇低谷,到第二回合成功卫冕,捷豹 TCS 车队逆风翻盘!“KIWI”组合上海两年两冠,续写传奇!
    的头像 发表于 06-06 09:12 970次阅读

    2025年开放原子校源行清华大学成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校源行”(清华)在清华大学成功举办
    的头像 发表于 04-22 16:46 1068次阅读