近期,来自富士通(Fujitsu)的研究员们宣布他们打破了ImageNet的训练速度记录——在74.7秒内达到75%的准确率。这比去年11月由索尼(Sony)创下的前纪录快了47秒。
团队取得这样的纪录,得益于日本东京大学(University of Tokyo)的AI Bridging Cloud Infrastructure(ABCI)系统上的2,048块NVIDIA Tesla V100 GPU,以及MXNet深度学习架构。
ABCI系统是日本最快的超级计算机,在世界超级计算机榜单中也名列前10。该系统由超过4,300块NVLink互联的NVIDIA V100 GPU提供算力。Sony此前保持的纪录也是借助此系统实现的。
富士通(Fujitsu)在一篇文章中介绍:“基于此技术,富士通实验室(Fujitsu Laboratories)深耕HPC发展,公司现已开发出了新的技术,能够在保证训练准确率的同时拓展每块GPU的计算量。”
为了对使用大批量mini-batch训练深度神经网络(DNN)时发生的验证准确性进行补偿,团队“使用了相关技术,在不影响准确率的同时,增大了小批量的体量。”
研究人员介绍说:“众所周知,具有数据并行性的分布式深度学习是加速集群训练的有效方法。通过这种方法,在集群上运行的所有步骤都具有相同的DNN模型和权重。”
研究人员们同时也借助了Tensor核心的混合精度。

该DNN架构经过优化,基于ImageNet在74.7秒的时间内完成 ResNet-50训练,而且验证准确率高达75.08%。
团队还能够使用高达81,920个的大批量mini-batch,同时保持75.08%的准确率(如上表中第3个数据点所示)。

为实现这一里程碑式的成果,大量的NVIDIA技术被应用其中,其中就包括层级对应的适应率缩放(Layer-wise Adaptive Rate Scaling)。
该项工作目前已在ArXiv 和富士通博客上发表。
-
NVIDIA
+关注
关注
14文章
5496浏览量
109101 -
深度学习
+关注
关注
73文章
5590浏览量
123912 -
富士通
+关注
关注
2文章
210浏览量
55813
原文标题:富士通借助 Tesla V100 Tensor核心GPU创下ImageNet新纪录
文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
富士通入选2025年Gartner生成式AI工程新兴市场象限领导者
富士通FRAM增强图传模块环境适应性
富士通发布2025财年上半年财报
富士通与英伟达扩大战略合作
除了准确率,电能质量在线监测装置在谐波源识别方面还有哪些重要指标?
电能质量在线监测装置识别谐波源的准确率有多高?
富士通FRAM秒写实时数据
富士通FRAM宽电压设计简化LED显示电源方案
富士通发布2025年技术与服务愿景
海思SD3403边缘计算AI数据训练概述
SDK如何控制DLP4500在一秒内投影60张图片?
浪潮信息:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用准确率
请问AFE4400 SPO2精度和准确率如何?
《富士通综合报告(Fujitsu Integrated Report 2024)》带你全面了解富士通
如何提升人脸门禁一体机的识别准确率?

富士通宣布打破了ImageNet的训练速度记录——在74.7秒内达到75%的准确率
评论