0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力提供多样、灵活的模型选择

NVIDIA英伟达 来源:NVIDIA英伟达 2024-09-09 09:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

在本案例中,Dify 以模型中立以及开源生态的优势,为广大 AI 创新者提供丰富的模型选择。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服务器产品,为 Dify.AI 提供了灵活多样的模型集成选择,专业、高效的模型接入方式让开发者用户能够构建丰富的 AI 应用场景。

AI 应用面临落地挑战

随着 AI 应用场景的不断丰富,Dify 在 AI 应用的落地方面面临了几个关键挑战,这些挑战成为了采用 NVIDIA 产品和技术的主要驱动力:

复杂应用场景需要多个模型结合使用:随着越来越丰富的 AI 应用情景探索,越来越多的企业都期望能灵活使用当前最先进的闭源或开源模型,来定制落地方案,以获得模型在不同情境下的能力表现、成本、性能等方面的最佳组合结果。

大模型的性能和稳定性风险:⼤模型的训练和推理对算力、算法、数据都有很高要求,如果选型不当或优化不足,可能影响应⽤的性能和稳定性。

数据安全和隐私保护风险:企业在落地 AI 应用时,出于对敏感场景应用和企业数据安全的考虑,会更倾向本地部署推理框架来运行他们的本地模型。

NVIDIA 助力提供多样、灵活的模型选择

Dify 平台与数百种专有/开源模型以及数十种推理提供商、自托管解决方案无缝集成,包括 LLM 推理框架、Rerank 模型、Embedding 模型等类型,允许用户根据其具体场景需要,随时切换/使用不同的模型能力。其中,Dify 集成了 API Catalog、NVIDIA NIM 和 Triton 推理服务器开源软件产品作为可选模型平台之一,具体作用如下所述:

提供丰富的预训练模型,满足多样化需求

API Catalog 提供了大量针对NVIDIA GPU优化的预训练模型,涵盖了 LLM、Embedding、Rerank 和 Vision 多个种类。它主要用于评估和测试,提供一个统一的接口,可以测试各种模型,节省开发成本。API Catalog 会持续更新最新的模型,帮助 Dify 用户加速前期的测试和评估,并为之后的量产部署做好铺垫,加速 AI 应用的开发和落地。

简化部署流程,加速生成式 AI 模型上线

NVIDIA NIM 将 AI 模型打包为容器化微服务,开发者只需几行代码即可完成部署,部署时间可从数周缩短到数分钟。这种简化的部署流程可以显著加速生成式 AI 模型的上线,使企业能够快速将模型集成到 Dify 的 AI 工作流中,实现 AI 应用落地。

优化推理性能,提供高效稳定的 AI 服务

Triton 推理服务器提供了一个优化和标准化的平台,用于部署和执行来自多种深度学习机器学习框架的 AI 模型。它适用于通用的 AI 推理工作负载,为开发者在 Dify 平台上编排 AI 应用提供高效稳定的模型服务。

灵活调用模型,适应不同场景需求

通过 Triton 推理服务器和 NVIDIA NIM 完成模型部署后,用户可以在 Dify 平台中轻松调用所需的模型。只需在模型设置中填写 Server URL、Model Name 等凭据,即可根据具体的场景需求,随时切换或使用不同的模型能力。这种灵活的模型调用方式可以帮助企业快速适应不断变化的业务需求,提高 AI 应用的适应性和可扩展性。

加入 NVIDIA Inception,

融入全球开发者社区生态

Dify 不仅与 NVIDIA 在模型层面实现了深度集成,其还于 2024 年 4 月入选了NVIDIA Inception 初创加速计划。Dify 也受邀参加了 NVIDIA 初创加速计划最新开启的系列技术加速营,获得了与众多 AI 创新者、行业客户、生态上下游企业交流合作和极大的市场曝光机会。

加入 NVIDIA 初创加速计划对 Dify 来说,标志着一个新的里程碑,Dify 将借助 NVIDIA 的影响力链接全球开发者,在其领先技术的助力下,不断突破,打造更繁荣的生态和产品。

Dify 创始人兼 CEO 张路宇表示:“Dify 成立的第一天,就定位是一个面向全球开发者用户的产品,我们希望接入全球领先的大模型,共创 AI 解决方案,为不同行业落地 AI 的企业、AI 创新者们提供开箱即用的 LLM 应用开发平台,这也是我们首选 NVIDIA 的原因。在全球的客户生态、开发者生态经营上,NVIDIA 毋庸置疑是我们最好的选择。”

繁荣的开源社区生态,

加速 AI 创新应用落地

Dify 团队成立于 2023 年 3 月,同年 5 月发布 Dify.AI 第一个版本并开源。基于 LLMOps 及后端即服务的理念,为企业提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,致力于打造⼀个开放的 LLM 应⽤开发平台,降低 LLM 应⽤程序的开发和部署复杂性,帮助应⽤开发者更快地搭建和运营⽣产级的⽣成式 AI 应⽤。

Dify 在开源社区受到全球开发者的关注和喜爱,在短短一年的时间内,stars 数已超过 36,000+,达到数十万次下载量,多次登榜 GitHub 全球趋势榜单。GitHub stars 已超越知名 AI Infra 产品如 LlamaIndex、flowise 等,仅次于 LangChain。面向需要探索 AI 应用创新、AI 应用落地业务的开发者或企业客户,Dify 提供成熟的应用开发工具平台,加速 AI 落地业务的过程。

截至 2024 年 4 月,Dify.AI 已经服务了十余家 500 强企业和数十家上市公司。全球领先企业选择 Dify 作为 LLM App Stack,标杆客户覆盖汽车、先进制造、消费、半导体、医药等行业,如理想汽车、研华股份、百胜中国、Panasonic、Advantech、安克创新、得到等。Dify.AI 同时也吸引了全球范围内关注 LLM 应用技术的创业者和服务商,他们可以基于 NVIDIA 的资源和生态,利用 Dify 作为开发工具,创造出更多创新性 AI 产品和服务,带来更多生态合作的空间。

NVIDIA 初创加速计划

Dify.AI是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。 NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构、创业孵化器、创业加速器、行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣、技术支持、市场宣传、融资对接、业务推荐等一系列服务,加速创业公司的发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109090
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296590
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964

原文标题:初创加速计划 | NVIDIA 赋能 Dify.AI,加速企业 AI 应用落地

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 488次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功能。
    的头像 发表于 11-21 09:25 533次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>助力</b>构建自己的AI<b class='flag-5'>模型</b>

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的本地部署。
    的头像 发表于 10-29 16:59 1015次阅读

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    。   借助全新的 NVIDIA Cosmos 世界基础模型,开发者可以生成多样化数据,从而大规模加速物理 AI 模型的训练。   来自斯 坦福大学、苏黎世
    的头像 发表于 09-30 09:52 2783次阅读
    <b class='flag-5'>NVIDIA</b> 利用全新开源<b class='flag-5'>模型</b>与仿真库加速机器人研发进程

    NVIDIA助力汤元科技突破智能驾驶数据获取与生成瓶颈

    苏州汤元科技有限公司(以下简称“汤元科技”)是一家专注于三维重建与世界模型的科技公司,为自动驾驶与具身智能提供高质量、多样化的训练数据。通过将自研的世界模型技术与
    的头像 发表于 09-06 15:16 1267次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 1393次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2推理<b class='flag-5'>模型</b>发布

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA Cosmos Reason-1-7B。这款先进的多模态大
    的头像 发表于 07-09 10:17 559次阅读

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 925次阅读

    NVIDIA携手谷歌云助力企业引入代理式AI

    谷歌 Gemini 模型即将支持本地部署,可通过搭载 NVIDIA Blackwell 架构的基础设施,在 Google 分布式云上运行 NVIDIA 机密计算。
    的头像 发表于 04-11 16:32 904次阅读

    NVIDIA助力解决量子计算领域重大挑战

    NVIDIA 加速量子研究中心提供了强大的工具,助力解决量子计算领域的重大挑战。
    的头像 发表于 03-27 09:17 996次阅读

    NVIDIA发布全球首个开源人形机器人基础模型Isaac GR00T N1

    NVIDIA 宣布推出一系列全新技术,助力人形机器人开发。其中包括全球首个开源且完全可定制的基础模型NVIDIA Isaac GR00T N1,该
    的头像 发表于 03-20 14:34 1219次阅读

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    月 18 日 ——  NVIDIA 今日发布具有推理功能的开源 Llama Nemotron 模型系列,旨在为开发者和企业提供业务就绪型基础,助力构建能够独立工作或以团队形式完成复杂
    发表于 03-19 09:31 335次阅读
    <b class='flag-5'>NVIDIA</b> 推出开放推理 AI <b class='flag-5'>模型</b>系列,<b class='flag-5'>助力</b>开发者和企业构建代理式 AI 平台

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何加速系统上为 AI 智能体提供强效
    的头像 发表于 01-09 11:11 1189次阅读

    NVIDIA推出面向RTX AI PC的AI基础模型

    NVIDIA 今日发布能在 NVIDIA RTX AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力
    的头像 发表于 01-08 11:01 870次阅读

    NVIDIA Cosmos世界基础模型平台发布

    NVIDIA 宣布推出NVIDIA Cosmos,该平台由先进的生成式世界基础模型、高级 tokenizer、护栏和加速视频处理管线组成,将推动自动驾驶汽车(AV)和机器人等物理 AI 系统的发展。
    的头像 发表于 01-08 10:39 1029次阅读