0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Merlin HugeCTR V3.4.1版本新增内容介绍

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-03-10 10:15 次阅读

Merlin HugeCTR(以下简称 HugeCTR)是 GPU 加速的推荐程序框架,旨在在多个 GPU 和节点之间分配训练并估计点击率(Click-through rate)。

此次v3.4更新涉及的模块主要为:

HugeCTR 分级参数服务器

HugeCTR Python API

相关介绍:

HugeCTR 分级参数服务器介绍

V3.4.1 版本新增内容

调整了整个代码库中日志消息的日志级别。

现已支持对具有多个标签的数据集进行推理:

“Softmax” 层现在已支持 FP16,并且支持混合精度以进行多标签推理。

支持多 GPU 离线推理:

我们通过 Python 接口支持多 GPU 离线推理,它可以利用Hierarchical Parameter Server并在多个设备上实现并发执行。更多信息请参考推理 API和多 GPU 离线推理笔记本。

HPS 已构建为独立库:

我们重构了代码库并将分层参数服务器构建为一个独立的库,以后会进一步封装。

metadata.json 简介:

添加了有关 Parquet data 中 _metadata.json 的详细信息。

增加了用于估计每个 GPU 的词汇量大小的文档和工具:

我们添加了一个工具来计算每个 GPU 的不同嵌入类型的词汇量大小,在此基础上,workspace_size_per_gpu_in_mb 可以根据嵌入向量大小和优化器类型评估更多信息请参考脚本。

训练中支持 HDFS :

a. 现在支持从 HDFS 加载和存储模型和优化器状态。

b. 增加了编译选项使 HDFS 的支持更加灵活。

c. 添加了一个笔记本来展示如何将 HugeCTR 与 HDFS 一起使用:

增加了一个演示如何分析模型文件的 Python 脚本和笔记本

错误修复:

修复了SOK 中的镜像策略错误

修复了无法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02中导入稀疏操作工具包的问题。

HugeCTR 参数服务器:修复了在未配置 RocksDB 时,可能会在初始化期间发生的访问冲突问题。

已知问题

HugeCTR 使用 NCCL 在 rank 之间共享数据,并且 NCCL 可能需要共享系统内存用于 IPC 和固定(页面锁定)系统内存资源。在容器内使用 NCCL 时,建议您通过发出以下命令(-shm-size=1g -ulimit memlock=-1) 来增加这些资源。

另见 NCCL 的 已知问题

还有 GitHub 问题

目前即使目标 Kafka broker 无响应,KafkaProducers 启动也会成功。为了避免与来自 Kafka 的流模型更新相关的数据丢失,您必须确保有足够数量的 Kafka brokers 启动、正常工作并且可以从运行 HugeCTR 的节点访问。

文件列表中的数据文件数量应不小于数据读取器的数量。否则,不同的 worker 将被映射到同一个文件,从而导致数据加载不会按预期进行。

正则化器暂不支持联合损失训练。

原文标题:Merlin HugeCTR v3.4.1 发布说明

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4415

    浏览量

    126652
  • 节点
    +关注

    关注

    0

    文章

    208

    浏览量

    24078
  • 服务器
    +关注

    关注

    12

    文章

    8111

    浏览量

    82491

原文标题:Merlin HugeCTR v3.4.1 发布说明

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LwIP v2.0版本更换为v2.1.2版本后接收不到数据了怎么解决?

    请教下,吧 LwIP v2.0 版本更换为 v2.1.2 版本后接收不到数据了,是怎么回事啊 ?? 之前使用 v2.0
    发表于 04-23 08:20

    美国Merlin公司加速自主飞行模拟器开发

    美国Merlin公司正全力加速自主飞行模拟器的开发进程,以推动航空领域的创新与发展。这一举措不仅体现了Merlin公司在技术研发方面的雄厚实力,也预示着自主飞行技术即将迎来新的突破。
    的头像 发表于 04-22 11:30 238次阅读

    使用1.9.0版本时,stm32cubemx生成ETH+LWIP代码,直接编译出错的原因?

    大小为1024字节,我每次给单片机发256字节。V1.9.0版本库,正常情况下,串口空闲中断里收到256字节。更换为1.10.0版本库,则DMA第一次收到256字节,第二次提示收到512字节,但前256
    发表于 03-25 08:10

    PSOC Creator由3.3版本升级到4.1版本后,程序的EEEPROM模块无法使用怎么解决?

    PSOC Creator由3.3版本升级到4.1版本后,程序的EEEPROM模块无法使用,请提供一下CY8C4247读写内部Flash的例程,谢谢 。
    发表于 02-01 06:58

    【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一好书

    并不是一简单罗列指令的书籍,而是一全面介绍指令设计理念的书籍。书籍的内容充分反映了最新的计算机指令设计的理念,这是我推荐该书的最主要理由。 为提升该书的趣味性,作者在页边加入约
    发表于 01-23 20:08

    气象监测设备的内容介绍

    气象监测设备的内容介绍
    的头像 发表于 12-13 15:37 153次阅读

    OpenHarmony 4.0 Release版本发布,新增4000+ API

    近日,OpenHarmony 4.0 Release版本如期发布,开发套件同步升级到API 10。相比3.2 Release版本,OpenHarmony 4.0 Release版本新增
    的头像 发表于 11-13 11:31 496次阅读

    NVIDIA Merlin 助力陌陌推荐业务实现高性能训练优化

    通过 Merlin 大幅提升大规模深度多目标精排模型训练性能 本案例中,NVIDIA 团队与陌陌推荐系统团队深度合作,共同使用 NVIDIA GPU 和 Merlin 软件解决方案替代其原有
    的头像 发表于 11-09 10:45 138次阅读
    NVIDIA <b class='flag-5'>Merlin</b> 助力陌陌推荐业务实现高性能训练优化

    求助,cmsis_RTOS v1版本怎么进临界?

    这个cmsis_RTOS v1版本怎么进临界? 难道是把所有任务挂起吗? V2 还可以锁内核
    发表于 11-02 06:15

    RT-Thread5.0.0版本下littlefs软件包编译出错如何解决?

    RT-Thread5.0.0版本下littlefs软件包编译出错,报错: packages\\\\littlefs-v2.3.0\\\\dfs_lfs.c(571): error:#136
    发表于 09-03 10:48

    抢先体验!OpenHarmony 4.0 Beta2新版本发布

    体验。欢迎开发者了解并升级使用,积极反馈宝贵建议、参与贡献,共同促进4.0版本的成熟。 为了方便社区开发者了解新版本能力,我们准备了版本上新内容介绍
    的头像 发表于 08-28 12:05 625次阅读

    OpenHarmony 4.0 Beta2新版本发布,邀您体验

    了解新版本能力,我们准备了版本上新内容介绍及相关文档资源,快来体验吧~ 新增和增强的特性 ArkUI • 支持命名路由的能力,
    的头像 发表于 08-24 21:10 441次阅读

    如何用M451读取USB磁盘内容的BMP文件

    应用程序:样本代码用M451读取了USB磁盘内容的 BMP 文件。 BSP 版本: M451 BSP v3.01.003 硬件: Nutiny-EVB-M451-LQFP100
    发表于 08-23 06:22

    STM32CubeMX从V5.1.0版本更新以后为什么还是英文?

    注意,不是CubeIDE汉化哦!听说STM32CubeMX从V5.1.0版本更新以后就支持中文界面了,为啥我的还是英文的呢?
    发表于 08-05 06:30

    KiCad EDA 版本说明

    的邮件列表说明,可能每年会升级一次主版本,2022 年时 v6.x.x,2023 年时 v7.x.x,未来到 2024 年时版本可能会是 v
    发表于 05-20 16:27