Nvidia用于开发和运行可理解和响应请求的对话式AI的GPU强化平台,已经达成了一些重要的里程碑,并打破了一些记录。
这对任何基于其技术进行开发的人来说意义重大——当中包括大大小小的公司,因为英伟达将很多用于实现这些进步的代码开源。那些代码用PyTorch编写,易于运行。
英伟达今天宣布的最大成果包括:BERT训练用时打破记录,进入1小时关口。BERT是世界上最先进的人工智能语言模型之一,也被广泛认为是自然语言处理(NLP)标杆的先进模型。Nvidia的AI平台仅仅需要53分钟就能够完成模型训练,经过训练的模型在短短2毫秒多一点的时间里(10毫秒在业内被认为是高水平线)就能够成功地做出推理(即利用通过训练学习到的能力得出结果)——又一个记录。
英伟达的这些突破不仅仅是吹嘘的资本——这些进步可为任何使用NLP对话式人工智能和GPU硬件的人提供切实的好处。Nvidia在它的其中一个SuperPOD系统上打破了训练时间记录,该SuperPOD系统由运行1472个V100 GPU的92个Nvidia DGX-2H系统组成;在运行Nvidia TensorRT的Nvidia T4 GPU上完成推理过程。Nvidia TensorRT在性能上超出高度优化的CPU许多个量级。不过,该公司将公开BERT训练代码和经过TensorRT优化的BERT样本,让所有人都可以通过GitHub利用。
除了这些里程碑以外,英伟达的研究部门还建立并训练了有史以来最大的一个基于“Transformer”的语言模型。这也是BERT的技术基础。该定制模型包含的参数多达83亿个,规模是当前最大的核心BERT模型BERT-Large的24倍。英伟达将这个模型命名为“Megatron”,它也对外提供了用于训练这个模型的PyTorch代码,因而其他人能够自行训练出类似的基于“Transformer”的大型语言模型。
-
AI
+关注
关注
91文章
41976浏览量
303075 -
英伟达
+关注
关注
23文章
4126浏览量
99776
原文标题:【网上研讨会】如何从海量的非结构化数据中提取和分析关键信息?
文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
直播预告|玄铁 x Canonical:从本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨
是德科技推出全新AI推理仿真平台
NVIDIA Vera Rubin平台开启代理式AI前沿
NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展
边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值
NVIDIA推出代理式AI蓝图与电信推理模型
AI推理芯片需求爆发,OpenAI欲寻求新合作伙伴
NVIDIA DGX SuperPOD为Rubin平台横向扩展提供蓝图
什么是AI模型的推理能力
使用NVIDIA NVLink Fusion技术提升AI推理性能
一文看懂AI训练、推理与训推一体的底层关系
Nvidia打破实时对话AI的训练和推理用时记录
评论