0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-11-19 14:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

赖耶科技作为一家专注于人工智能领域的创新企业,于 2024 年正式加入NVIDIA 初创加速计划(NVIDIA Inception Program),并在提高算力资源整合使用效率及效果领域,始终与 NVIDIA 技术团队保持合作。赖耶科技通过NVIDIA AI Enterprise平台打造的超级 AI 工厂,致力于加速大模型场景应用的深化拓展及落地,为企业与个人开发者提供高性能的 Token 服务,助力新质生产力加速发展。

大模型场景应用落地的挑战

赖耶科技的愿景是建立“人工智能工厂(AI Factory)”为客户提供“开箱即用”的企业级人工智能解决方案。在大模型场景应用落地过程中,行业面临着诸多挑战:

数据复杂性:大模型需要处理海量的数据,且数据来源多样、格式复杂,如何有效地整合和管理这些复杂数据是一个重大挑战。

计算资源需求:大模型的训练和推理需要大量的计算资源,包括 GPU 等硬件设备,这对企业的成本和技术实力提出了相对高的要求。

模型准确性和可靠性:大模型的输出结果直接影响到企业决策和业务发展,因此模型的准确性和可靠性至关重要。

应用场景适配:不同的企业和行业有不同的需求和应用场景,如何将大模型适配到具体的场景中,以发挥其最大的价值,是一个亟待解决的问题。

NVIDIA AI Enterprise 最佳实践,

推动大模型应用的超级 AI 工厂

赖耶科技基于 NVIDIA 企业 AI 套件 NVIDIA AI Enterprise 打造的赖耶超级 AI 工厂,从构成上分为基础架构、大模型生产框架和智能体应用三部分。

基础架构层:作为赖耶超级 AI 工厂的底层操作系统,是由万卡大规模集群管理系统 KAA 和赖耶集群堆叠全栈优化方案 MONA 组成。基于 NVIDIA AI Enterprise 的 BCME(Base Command Manager Essentials)组件对万卡集群进行部署和管理,实现了 IO 通讯优化、资源虚拟化、云原生管理和编排、高性能多租户隔离、计费计量、动态部署扩展、GPU 驱动适配等功能。

大模型生产框架:中间层的 MANAS 大模型生产框架基于 NVIDIA AI Enterprise 的NeMo Framework提供核心组件,涵盖从数据处理到模型训练、模型对齐、模型微调和企业部署过程中对安全审查的安全护栏等全套功能。

智能体应用层:最上层的 LIM(Laiye Inference Microservice) 智能体服务与生产工厂,是可快速部署的大模型微服务。基于NVIDIA NIM提供的核心能力,能够在短时间内完成系统集成。面向企业 IT 团队,提供了易用无代码化的多模态知识库、多模态微调数据集、大模型微调定制和版本管理、多模态智能对话和企业搜索、行业智能体参考设计等一站式企业大模型定制化平台。

赖耶超级 AI 工厂提供企业大模型生产和场景应用两大核心功能,大模型生产功能包含了大规模 GPU 集群的组网调优、模型的稳定性训练和企业垂类大模型定制;企业场景应用功能,提供了开箱即用的 OpenAI 兼容的大模型 API 微服务,以及屏蔽了 GPU 底层复杂技术细节的加速推理镜像服务。

赖耶 AI 超级工厂是基于 NVIDIA AI Enterprise 的最佳实践,目前已在多家千 P 级算力中心完成落地应用,在大模型训练效率和推理性能上达到了同类型最佳水平,帮助各行各业的企业以更低成本、更快速度将大模型应用到实际场景中。

北京赖耶信息科技有限公司 CEOLucas Dai 表示:“赖耶科技通过与 NVIDIA 团队合作,基于 NVIDIA AI Enterprise 打造的超级 AI 工厂,帮助企业快速定制专属的大模型。我们的平台将企业从模型开发到应用落地的周期从几个月缩短至几天或几周,大幅提高了业务响应速度,降低了运营成本。赖耶超级 AI 工厂专注于为企业提供开箱即用的解决方案,推动智能化转型,助力企业在复杂的业务环境中取得更高效的成果。”

大模型场景应用落地实例

案例一:多模块混合架构提升天气预测能力

此气象大模型在气象领域表现突出,采用多模块混合架构,结合深度学习、图神经网络与传统物理模型,显著提升长期天气模式预测能力。该模型能精准捕捉从局地到全球的大气动力学特征,实现小时到月尺度的高精度预报,最高空间分辨率达 1 公里。

通过多尺度输入处理、先进编码器等核心组件的协同工作,该模型在国际测试中预报精度超越传统数值模型,特别在 7-15 天的中期预报中提高近 20%,15-30 天的超长期预报达到传统模型 7 天水平。赖耶科技基于 NVIDIA AI Enterprise 提供的加速组件,让计算效率提升近万倍,实现全球尺度和百米局地尺度间无缝切换,预报期延长至 30 天。

案例二:优化数据处理与分析效率

赖耶大模型的 API 服务是基于 NVIDIA NIM 提供快速和稳定模型部署和发布,其成功实现了大模型在大数据企业应用中的落地。该平台赋能企业内部各部门,不仅提升了数据处理和分析的效率,还通过大模型的强大自然语言处理能力,优化了企业的内部沟通和客户服务流程。平台亦可快速生成复杂的商业报告,帮助管理层做出更明智的决策。

案例三:提升集群管理与算力利用率

该算力中心部署了赖耶超级 AI 工厂,对万卡规模的集群进行管理和性能优化,提供了高度可靠的模型训练服务,对整体集群的模型算力利用率 MFU(Model FLOPs Utilization)提升了 2 倍,并且提供的大模型 API 微服务,面向区域内客户提供大模型服务,实现了从算力运营到 Token 运营的转变,达到了算力增值运营的目的,也让企业能更便捷地使用大模型。

未来展望

期望在不久的将来,大模型能在更多领域得到广泛应用,不仅惠及更多企业,还将为社会的发展带来更多价值。赖耶科技将继续与 NVIDIA 技术团队合作,为企业实现大模型 Token 赋能,加速大模型场景应用落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5721

    浏览量

    110218
  • AI
    AI
    +关注

    关注

    91

    文章

    41834

    浏览量

    302983
  • 人工智能
    +关注

    关注

    1821

    文章

    50471

    浏览量

    267612

原文标题:赖耶科技基于 NVIDIA AI Enterprise 打造超级 AI 工厂,为企业提供生成式 AI 解决方案

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA与Google Cloud携手推进代理式与物理AI发展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 A
    的头像 发表于 04-27 15:35 573次阅读

    NVIDIA发布Vera Rubin DSX AI Factory参考设计

    Rubin DSX 的 NVIDIA Omniverse DSX Blueprint,旨在为大规模设计、建设及运营提供物理精确的 AI 工厂数字孪生。
    的头像 发表于 03-18 14:42 715次阅读

    生命科学领先企业采用 NVIDIA BioNeMo 平台加速 AI 驱动的药物研发

    —— NVIDIA 近日宣布对 NVIDIA BioNeMo™ 进行重大扩展, 将通过一个开放式开发平台支持实现实验室闭环(lab-in-the-loop)工作流,以推动
    的头像 发表于 01-14 11:40 725次阅读
    生命科学领先企业采用 <b class='flag-5'>NVIDIA</b> BioNeMo <b class='flag-5'>平台</b>加速 <b class='flag-5'>AI</b> 驱动的药物研发

    NVIDIA Spectrum-X以太网硅光技术助力AI工厂网络创新

    NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络,通过 NVIDIA Spectrum-X 以太网硅光
    的头像 发表于 01-14 09:06 973次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X以太网硅光技术助力<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>网络创新

    微软全新AI超级工厂Fairwater在亚特兰大落成

    微软正式发布位于美国乔治亚州亚特兰大的 Azure AI 数据中心 Fairwater 站点。全新的数据中心将与威斯康星州的首个 Fairwater 站点、前几代 AI 超级计算机以及全球 Azure 数据中心深度互联,共同构建
    的头像 发表于 12-09 17:31 913次阅读

    NVIDIA扩大与微软合作推动AI超级工厂建设

    在 Microsoft Ignite 大会上,NVIDIA 扩大与微软的合作,包括在由 NVIDIA Blackwell 平台驱动的全新 Microsoft Fairwater AI
    的头像 发表于 12-01 09:52 1075次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功
    的头像 发表于 11-21 09:25 1671次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark助力构建自己的<b class='flag-5'>AI</b>模型

    三星携手NVIDIA 以全新AI工厂引领全球智能制造转型

    AI平台推动制造与人形机器人技术,迈向更高水平的智能化与自主化     中国  – 2025年10月31日 –  三星半导体今日宣布与NVIDIA携手打造人工智能(
    的头像 发表于 11-03 13:41 2070次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 E
    的头像 发表于 07-28 15:07 1515次阅读

    摩尔线程“AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进模型的“
    的头像 发表于 07-28 11:28 4931次阅读
    摩尔线程“<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>”:五大核心技术支撑,<b class='flag-5'>打造</b>大模型训练<b class='flag-5'>超级</b><b class='flag-5'>工厂</b>

    摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进模型的“
    发表于 07-28 10:34 2970次阅读
    摩尔线程“<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>”:以系统级创新定义新一代<b class='flag-5'>AI</b>基础设施

    NVIDIA AI技术助力欧洲医疗健康行业发展

    从构建全球规模最大的生物多样性数据库,到打造赋能罕见病研究的 AI 工厂NVIDIAAI 初创企业生态系统正持续为欧洲医疗健康领域注
    的头像 发表于 06-19 14:40 3580次阅读

    NVIDIA计划打造全球首个工业AI平台

    NVIDIA 宣布,其正在为欧洲制造商构建全球首个工业 AI 云。这家总部位于德国的 AI 工厂将配备 1 万个 GPU,包括通过
    的头像 发表于 06-16 14:17 1713次阅读

    NVIDIA携手诺和诺德借助AI加速药物研发

    NVIDIA 宣布与诺和诺德开展合作,借助创新 AI 应用加速药物研发。此次合作也将支持诺和诺德与丹麦 AI 创新中心 (DCAI) 关于使用 Gefion AI
    的头像 发表于 06-12 15:49 1571次阅读

    NVIDIA携手合作伙伴提升AI智能体的交互能力

    NVIDIA Enterprise AI Factory 的经验证设计和全新的 NVIDIA AI Blueprint 可帮助企业部署具有沟
    的头像 发表于 05-22 09:52 1293次阅读