微软已经为深度学习优化库 DeepSpeed 申请了商标保护。该商标于2020年12月8日提交,其中提到“为人工智能处理和深度学习提供临时使用的在线不可下载的计算机软件”,这表明微软可能在考虑通过在线云服务提供 DeepSpeed。
该库于今年 2 月发布,可以在适度的硬件上训练大规模的人工智能模型。它只需要使用 800 块 Nvidia V100 显卡就可以创建具有万亿参数的深度学习模型,是目前世界上最大的模型的 5 倍多。如果没有DeepSpeed,同样的任务需要 4000 块 Nvidia A100(性能比 V100 快2.5倍),而且事件缩短了 100 多天。
在 GPT-3 显示模型在神经网和数据集越大的情况下继续改进后,这个工具特别有用。然而,这确实有可能将最新的创新推到资源较少的小型团队的范围之外,但DeepSpeed已经允许这些团队以最小的硬件与更大的服务竞争。转移到云处理可能会使大型模型AI训练更容易获得。
责任编辑:haq
-
微软
+关注
关注
4文章
6719浏览量
107344 -
人工智能
+关注
关注
1813文章
49734浏览量
261496 -
云服务
+关注
关注
0文章
860浏览量
40436
发布评论请先 登录
是否有可能在 FX10 中嵌入一个电源传输堆栈并使用这两个引脚进行通信?
HarmonyOS5云服务技术分享--ArkTS开发Node环境
有可能在 FX3 GPIF2 中创建两个独立的状态机吗?
ads8568采集基本正常,但可能在某一次上电后,出现不工作的状态,为什么?
微软最新消息:微软入欧洲云服务提供商协会 微软执行副总裁将离职
微软调整协议:OpenAI获准使用其他云服务
微软调整协议,OpenAI获准使用其他云服务
华为 Flexus 云服务器打造 Laverna 在线笔记应用

微软可能在考虑通过在线云服务提供DeepSpeed
评论