0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-04-28 10:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言模型推理。

Phi-3 Mini 与 10 倍之于其大小的模型能力不相上下。不同于仅用于研究的 Phi-2,Phi-3 Mini 不仅可以用于研究,同时还可以用于多种商业用途。搭载 NVIDIA RTX GPU 的工作站或搭载 GeForce RTX GPU 的 PC 可以使用 Windows DirectML 或 TensorRT-LLM 在本地运行该模型。

该模型有 38 亿个参数,在 512 个 NVIDIA Tensor Core GPU 上使用 3.3 万亿个 token 训练而成,仅耗时七天时间。

Phi-3 Mini 有两个版本,一个版本支持 4K token,另一个版本支持 128K token,是同类模型中第一个支持超长上下文的模型。因此,开发者在向该模型提问时,可以使用 128,000 个 token(模型能够处理的最小语言单位),使模型能够做出更加符合现实的回答。

开发者可以在 ai.nvidia.com上试用带有 128K 上下文窗口的 Phi-3 Mini。该模型被打包成 NVIDIA NIM,这是一项带有标准应用编程接口的微服务,可以部署在任何位置。

在边缘高效运行

自主机器人和嵌入式设备开发者可以通过社区教程(如 Jetson AI Lab)学习创建和部署生成式 AI,并在 NVIDIA Jetson 上部署 Phi-3。

Phi-3 Mini 模型只有 38 亿个参数,非常小巧紧凑,可以在边缘设备上高效运行。参数就像内存中的旋钮,可在模型训练过程中进行精确的调整,使模型能够对输入的提示做出高度准确的响应。

Phi-3 可以在成本和资源受限的用例中提供帮助,尤其是较简单的任务。该模型在关键语言基准测试中的表现优于一些较大的模型,同时在满足延迟要求的情况下给出结果。

TensorRT-LLM 将支持 Phi-3 Mini 的长上下文窗口,并使用 LongRoPE、FP8/飞行批处理等众多优化措施和内核来提高推理吞吐量,减少延迟。TensorRT-LLM 的应用很快将在 GitHub 上的示例文件夹中提供。

开发者可以转换为 TensorRT-LLM 检查点格式,该格式针对推理进行了优化,可以轻松地与 NVIDIA Triton 推理服务器一起部署。

开发开放式系统

NVIDIA 是开源生态系统的积极贡献者,已经发布了 500 多个带有开源许可证的项目。

NVIDIA 为 JAX、Kubernetes、OpenUSD、PyTorch 和 Linux 内核等众多外部项目做出了贡献,还为各种开源基金会和标准机构提供支持。

此次发布建立在 NVIDIA 与微软深厚的合作基础上,双方的合作为加速 DirectML、Azure 云、生成式 AI 研究以及医疗和生命科学等领域的创新铺平了道路。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30576

    浏览量

    219430
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109045
  • 嵌入式设备
    +关注

    关注

    0

    文章

    118

    浏览量

    17643
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6393
  • 大模型
    +关注

    关注

    2

    文章

    3439

    浏览量

    4960

原文标题:小巧而强大:NVIDIA 加速微软 Phi-3 开源“小语言模型”

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 460次阅读

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展 AI 的普及并推
    的头像 发表于 11-06 11:49 678次阅读

    NVIDIA宣布开源Aerial软件

    NVIDIA 开源其 Aerial 软件,并将 NVIDIA Sionna 研究套件和 Aerial 测试平台引入 NVIDIA DGX Spark 平台,为研究人员提供强大的工具和便
    的头像 发表于 11-03 15:14 560次阅读

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的
    的头像 发表于 10-29 16:59 1003次阅读

    NVIDIA开源Audio2Face模型及SDK

    NVIDIA 现已开源 Audio2Face 模型与 SDK,让所有游戏和 3D 应用开发者都可以构建并部署带有先进动画的高精度角色。NVIDIA
    的头像 发表于 10-21 11:11 532次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>开源</b>Audio2Face<b class='flag-5'>模型</b>及SDK

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器人。   全新的 NVIDIA Isaac GR00T 开源基础模型将为机器人赋予接近人类的推理能力,使其能够拆解复杂指令,并借助已有知识与常识执行任务
    的头像 发表于 09-30 09:52 2782次阅读
    <b class='flag-5'>NVIDIA</b> 利用全新<b class='flag-5'>开源</b><b class='flag-5'>模型</b>与仿真库<b class='flag-5'>加速</b>机器人研发进程

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma
    的头像 发表于 07-16 09:16 1853次阅读

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 912次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展。NVIDIA微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的发展。
    的头像 发表于 05-27 14:03 751次阅读

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义千问 Qwen3,此次 Qwen3 开源
    的头像 发表于 05-08 11:45 2546次阅读
    <b class='flag-5'>NVIDIA</b>使用Qwen<b class='flag-5'>3</b>系列<b class='flag-5'>模型</b>的最佳实践

    Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用

    -Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用 Cognizant将在关键增长领域提供解决方案,包括企业级AI智能体、定制化行业大型语言模型及搭载
    的头像 发表于 03-26 14:42 578次阅读
    Cognizant将与<b class='flag-5'>NVIDIA</b>合作部署神经人工智能平台,<b class='flag-5'>加速</b>企业人工智能应用

    NVIDIA Isaac GR00T N1开源人形机器人基础模型+开源物理引擎Newton加速机器人开发

    NVIDIA Isaac GR00T N1开源人形机器人基础模型+开源物理引擎Newton加速机器人开发
    的头像 发表于 03-20 16:56 1272次阅读

    英伟达GTC25亮点:NVIDIA Dynamo开源加速并扩展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理
    的头像 发表于 03-20 15:03 1072次阅读

    在算力魔方上本地部署Phi-4模型

    智能水平上的一大飞跃。它不仅达到了之前只有Llama 3.1 405B模型才具备的智能水平,而且还超越了11月发布的GPT-4o模型。 本文我们将分享微软刚刚发布的Phi-4
    的头像 发表于 01-15 11:05 779次阅读
    在算力魔方上本地部署<b class='flag-5'>Phi</b>-4<b class='flag-5'>模型</b>

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何
    的头像 发表于 01-09 11:11 1179次阅读