0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Merlin HugeCTR V3.4.1版本新增内容介绍

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-03-10 10:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Merlin HugeCTR(以下简称 HugeCTR)是 GPU 加速的推荐程序框架,旨在在多个 GPU 和节点之间分配训练并估计点击率(Click-through rate)。

此次v3.4更新涉及的模块主要为:

HugeCTR 分级参数服务器

HugeCTR Python API

相关介绍:

HugeCTR 分级参数服务器介绍

V3.4.1 版本新增内容

调整了整个代码库中日志消息的日志级别。

现已支持对具有多个标签的数据集进行推理:

“Softmax” 层现在已支持 FP16,并且支持混合精度以进行多标签推理。

支持多 GPU 离线推理:

我们通过 Python 接口支持多 GPU 离线推理,它可以利用Hierarchical Parameter Server并在多个设备上实现并发执行。更多信息请参考推理 API和多 GPU 离线推理笔记本。

HPS 已构建为独立库:

我们重构了代码库并将分层参数服务器构建为一个独立的库,以后会进一步封装。

metadata.json 简介:

添加了有关 Parquet data 中 _metadata.json 的详细信息。

增加了用于估计每个 GPU 的词汇量大小的文档和工具:

我们添加了一个工具来计算每个 GPU 的不同嵌入类型的词汇量大小,在此基础上,workspace_size_per_gpu_in_mb 可以根据嵌入向量大小和优化器类型评估更多信息请参考脚本。

训练中支持 HDFS :

a. 现在支持从 HDFS 加载和存储模型和优化器状态。

b. 增加了编译选项使 HDFS 的支持更加灵活。

c. 添加了一个笔记本来展示如何将 HugeCTR 与 HDFS 一起使用:

增加了一个演示如何分析模型文件的 Python 脚本和笔记本

错误修复:

修复了SOK 中的镜像策略错误

修复了无法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02中导入稀疏操作工具包的问题。

HugeCTR 参数服务器:修复了在未配置 RocksDB 时,可能会在初始化期间发生的访问冲突问题。

已知问题

HugeCTR 使用 NCCL 在 rank 之间共享数据,并且 NCCL 可能需要共享系统内存用于 IPC 和固定(页面锁定)系统内存资源。在容器内使用 NCCL 时,建议您通过发出以下命令(-shm-size=1g -ulimit memlock=-1) 来增加这些资源。

另见 NCCL 的 已知问题

还有 GitHub 问题

目前即使目标 Kafka broker 无响应,KafkaProducers 启动也会成功。为了避免与来自 Kafka 的流模型更新相关的数据丢失,您必须确保有足够数量的 Kafka brokers 启动、正常工作并且可以从运行 HugeCTR 的节点访问。

文件列表中的数据文件数量应不小于数据读取器的数量。否则,不同的 worker 将被映射到同一个文件,从而导致数据加载不会按预期进行。

正则化器暂不支持联合损失训练。

原文标题:Merlin HugeCTR v3.4.1 发布说明

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5335

    浏览量

    136245
  • 节点
    +关注

    关注

    0

    文章

    232

    浏览量

    25713
  • 服务器
    +关注

    关注

    14

    文章

    10459

    浏览量

    91872

原文标题:Merlin HugeCTR v3.4.1 发布说明

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OpenAI正式发布ChatGPT Images 2.0版本

    在人工智能技术迅猛发展的浪潮中,OpenAI始终是引领行业变革的先锋力量。近日,OpenAI正式发布ChatGPT Images 2.0版本,这一消息如同一颗重磅炸弹,在科技圈引发了强烈反响,在
    的头像 发表于 04-22 11:32 4656次阅读

    达实AIoT智能物联网管控平台V7.1版本更新升级

    2026年3月17日,达实智能31周年庆典暨“AI+物联网平台”应用成果汇报会成功举办。达实智能研发中心产品经理袁宜峰博士发布了AIoT智能物联网平台V7.1版本
    的头像 发表于 03-19 11:10 703次阅读

    【「Altium Designer 25 电路设计精进实践」阅读体验】+本书概览与内容特点介绍

    本文以AD 25版本为依托,介绍了AD25进行电子电路设计的方法,理论结合实践。 内容概览先来概览下本书的内容,看一书的
    发表于 02-14 15:56

    索尼更新相机遥控软件开发包2.01版本

    2026年2月03日,索尼(中国)有限公司正式发布了可通过电脑远程操控索尼相机的相机遥控软件开发包(Camera Remote SDK)2.01版本,本次更新带来了2个新功能,新增支持机型ILCE-7M5、PXW-Z380、DSC-RX1RM3等。
    的头像 发表于 02-03 16:59 993次阅读

    西门子PCB DFM分析工具Valor NPI 2510版本新增功能

    Valor NPI 2510 版本新增多项检查功能、提升制造风险识别,并推出令人瞩目的 3D 可视化增强特性,这标志着产品的重大升级。Valor NPI 的 3D 视图经过重新设计,让可制造性设计 (DFM) 结果的查看更直观、精准。
    的头像 发表于 01-04 16:10 856次阅读
    西门子PCB DFM分析工具Valor NPI 2510<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b>功能

    AMD Vivado Design Suite 2025.2版本现已发布

    AMD Vivado Design Suite 2025.2 版本现已发布,新增对 AMD Versal 自适应 SoC 的设计支持,包含新器件支持、QoR 功能及易用性增强。
    的头像 发表于 12-09 15:11 1533次阅读

    RT-Thread Studio V2.3.0 版本正式发布!

    RT-ThreadStudioV2.3.0亲爱的开发者们,我们很高兴地宣布RT-ThreadStudio版本更新啦!V2.3.0版正式发布!RT-ThreadStudioV2.3.0更新内容1
    的头像 发表于 11-29 09:29 1494次阅读
    RT-Thread Studio <b class='flag-5'>V</b>2.3.0 <b class='flag-5'>版本</b>正式发布!

    Quartus Prime Pro 25.1版本的安装和使用

    如果用户开发板是基于Agilex 3、Agilex 5等高阶器件,则需要安装高版本的Quartus软件比如Quartus Prime Pro 25.1版本,这个版本在安装包和license获取(免费)等方面跟以往的Quartus
    的头像 发表于 10-07 13:06 3385次阅读
    Quartus Prime Pro 25.1<b class='flag-5'>版本</b>的安装和使用

    开鸿Bot系列大版本更新:体验稳定升级,乐享高效协同!

    V5.0.1.22版本开鸿Bot系列今日,开鸿Bot系列迎来第二次大版本更新——V5.0.1.22。此次版本更新致力于进一步提升系统稳定性与
    的头像 发表于 09-26 17:06 1630次阅读
    开鸿Bot系列大<b class='flag-5'>版本</b>更新:体验稳定升级,乐享高效协同!

    NVIDIA RAPIDS 25.06版本新增多项功能

    RAPIDS 是一套面向 Python 数据科学的 NVIDIA CUDA-X 库,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是一种面向图
    的头像 发表于 09-09 09:54 1383次阅读

    开鸿Bot系列V5.0.1.10版本升级!

    开鸿Bot系列更新至V5.0.1.10版本,此次升级聚焦功能优化及系统稳定性提升,在分布式能力、文件分享、打印功能及界面显示等方面进行了多项改进,同时修复了多个已知问题,进一步提升了系统的可靠性
    的头像 发表于 08-08 18:58 940次阅读
    开鸿Bot系列<b class='flag-5'>V</b>5.0.1.10<b class='flag-5'>版本</b>升级!

    匠芯创发布新版GUI开发工具 新增多国语言设置等功能

    。此次版本更新,为用户带来了诸多实用的新功能,进一步提升了设计体验和开发效率。在V1.3.0版本中,AiUIBuilder新增了多国语言切换功能,支持设计界面显示
    的头像 发表于 08-07 15:36 1657次阅读
    匠芯创发布新版GUI开发工具 <b class='flag-5'>新增</b>多国语言设置等功能

    请问k230创乐博V3.0版本如何使用ADB传输文件呢?

    请问k230 创乐博V3.0版本如何使用ADB传输文件?
    发表于 06-24 07:57

    CANoe产品体系19版本新特性及新增Option(上)

    版本持续助力当前车辆E/E架构中ECU开发验证,同时赋能后续智能网联电动车型预研验证。新版本CANoe产品体系新增数据驱动的DDS、车辆互联服务和高效电机模型库,进一步支持CANXL
    的头像 发表于 06-11 10:03 3340次阅读
    CANoe产品体系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    支持HPM6P00/HPM5E00系列!HPMicro Manufacturing Tool v0.6.0发布

    各位先楫的小伙伴久等了,HPMicroManufacturingTool0.6.0版本正式发布啦!该版本包含多个模块的更新优化,让我们抓紧时间先睹为快!v0.6.0版本主要更新
    的头像 发表于 06-04 08:28 2932次阅读
    支持HPM6P00/HPM5E00系列!HPMicro Manufacturing Tool <b class='flag-5'>v</b>0.6.0发布