0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA系统团队三连胜的秘诀都在这篇

世强SEKORM 来源:NVIDIA英伟达中国 作者:NVIDIA英伟达中国 2021-08-02 14:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在应对重大行业挑战方面拥有大量成功经验的 NVIDIA 专家分享了打造出色推荐系统的制胜诀窍。

“三连胜”之战已经到了最后的冲刺关头。

在截止时间前五分钟,这支团队提交了竞赛作品,这是今年第三次也是难度最高的一次推荐系统数据科学竞赛。它叫做 RecSys,是计算机科学一个相对较新的分支,它催生了机器学习领域常用的应用程序之一,这一程序帮助数百万人找到他们想看、想买和想玩的内容。

该团队共使用了六个 AI 模型,达到了比赛规定的 20 千兆字节上限,所有这些模型都是根据他们研究 7.5 亿个数据点的经验精挑细选出来的。这次比赛有一项不同寻常的规则,要求模型必须基于一个云端 CPU 的单一内核运行,并且运行时间不能超过 24 小时。

他们按下了提交按钮,静静等待。

23 小时 40 分钟后,一封电子邮件送来捷报:他们位列榜首。

紧扣截止时间

根据 6 月 28 日正式宣布的比赛结果,这支由七人组成的 NVIDIA 参赛团队第二次赢得 ACM RecSys 2021 挑战赛。

“这封电子邮件的到来可以说是紧扣截止时间 – 如果再晚 20 分钟,我们就超出 24 小时的运行时间了,” Chris Deotte 说道,他是参赛小组的成员之一,也是被视为线上数据科学界的奥林匹克的卡格尔比赛的大师级人物。

“我们当时真的很紧张,” Benedikt Schifferer 说,他是帮助设计 NVIDIA Merlin 框架的团队成员之一,该框架可以帮助用户快速建立自己的推荐系统。

GPU 本可以在很短的时间内完成推理工作。这支团队中常驻巴西的卡格尔比赛大师 Gilberto Titericz 表示,让推理工作去适应 CPU 核心“就好像回到了远古时代”。

事实上,比赛一结束,该团队就展示了在 CPU 核心上花费近 24 小时的推理工作,在单个 NVIDIA A100 Tensor Core GPU 上运行只需 7 分钟。

在每天 4 千万个数据点中找出推荐项

在比赛中,Twitter 在 28 天内每天向参与者提供数百万个数据点,并要求他们预测用户会点赞或转推哪些推文。这是这一针对 RecSys 的领先技术会议发起的行业实力挑战,吸引了来自 Facebook、Google、Spotify 等公司的优秀工程师

这个学科领域真的很难,但也非常实用。推荐系统为我们的数字经济提供发展动力,通过比传统搜索更快、更智能的方式提供建议。

行业挑战赛有助于推动这一领域的发展,让每个人都能从中受益,不论他们是在为配偶寻找完美的礼物,还是尝试在网上寻找一位老朋友。

五个月,三连胜

今年早些时候,NVIDIA 团队在 Booking.com 挑战赛的 40 支参赛小组中拨得头筹。他们使用数百万个匿名数据点来准确的预测了欧洲度假者最终将选择前往的城市。

今年 6 月,另一项顶级 RecSys 大赛SIGIR 电子商务数据挑战赛设置了更高的门槛。

信息检索特别兴趣小组 SIGIR 的年度会议吸引了来自阿里巴巴和沃尔玛实验室的专家。其 2021 年挑战赛提供了 3700 万个在线购物会话的数据点,并要求参赛者预测用户会购买哪些产品。

由于这场比赛与 ACM RecSys挑战赛的时间重叠,NVIDIA 团队不得不兵分两路,各有侧重地参与不同的比赛。一些团队成员在此压力下正埋头为 ACM RecSys 会议撰写论文。

“快攻”艺术

其中一只 NVIDIA 团队共包含五名成员,分别身处巴西、加拿大、法国和美国在每个排行榜中这只团队均排名第一或第二。能取得这样出色的整体表现,主要有两个因素。

其一,他们在 Transformer 模型上下了很大功夫,这些模型是为自然语言处理开发的,并越来越多地被 RecSys 所采用。

其二,他们深谙轮班工作的工作方法。“在一名成员将要入睡时,另一名身处不同时区的成员就可以接手工作,”Merlin 团队负责人 Even Oldridge 说。

“在一切顺利时,这种做法非常有效,我很惊讶我们在过去一年中取得的成就,这不但培养了我们的内部知识,也树立了我们在 RecSys 社区中的地位,让我们能够在 5 个月内赢得三场重要比赛。”

尊重用户隐私

这项比赛要求模型在对用户没有任何背景了解的情况下对用户进行预测,参赛者对于用户的所知仅限于其当前浏览会话。

位于圣保罗的领导 NVIDIA SIGIR 团队的 Merlin 资深研究员 Gabriel Moreira表示:“这是一项重要的任务,因为有时用户希望匿名浏览,并且一些隐私法限制了对于用户历史信息的访问。”

这场比赛标志着该团队首次在挑战赛的关键部分只使用 Transformer 模型。Moreira 的团队致力于让每一位 Merlin 客户更轻松地获享庞大的神经网络

从三连胜到四连胜

6 月 30 日,NVIDIA在 RecSys 挑战赛取得四连胜。行业基准组织 MLPerf 宣布,NVIDIA及 其合作伙伴在其所有最新训练基准测试中均创下新纪录,其中包括一个有关推荐系统的基准测试。

参赛团队描述了他们取得的成果——即在不到一分钟内训练基于 14 个NVIDIA DGX系统的推荐系统,与一年前提交的成果相比,速度加快了 3.3 倍。

分享经验心得

这些竞赛激发了新技术的创意,这些新技术被纳入像 Merlin 这样的 RecSys 框架,以及 NVIDIA 深度学习学院所拥有的相关工具、论文和在线课程。以达到最终目标:帮助每个人取得成功。

在采访中,NVIDIA 的 RecSys 专家自由地分享了他们的技术诀窍 —— 一半是艺术,一半是科学。

关于如何打造出色 RecSys 的

专业小贴士

一种最佳实践是使用多种模型,并使其协同工作。

在 ACM RecSys 挑战赛中,团队同时使用了树状和神经网络模型。一个阶段的输出成为了下一个阶段的输入,这一过程称为推叠。

NVIDIA 卡格尔比赛大师团队的新成员 Bo Liu 表示:“单个模型可能会因为数据错误或收敛问题而出错,但如果把几个模型结合起来,那么力量就会无比强大。”

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5513

    浏览量

    109182

原文标题:NVIDIA推荐系统团队三连胜的获胜秘诀:想你所想

文章出处:【微信号:sekorm_info,微信公众号:世强SEKORM】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OpenAI和NVIDIA宣布达成合作,部署10吉瓦NVIDIA系统

    此次合作将助力 OpenAI 构建和部署至少 10 吉瓦(gigawatt)的 AI 数据中心,这些数据中心将采用 NVIDIA 系统,包含数百万块 NVIDIA GPU,为 OpenAI 的下一代 AI 基础设施提供支持。
    的头像 发表于 09-23 14:37 1241次阅读
    OpenAI和<b class='flag-5'>NVIDIA</b>宣布达成合作,部署10吉瓦<b class='flag-5'>NVIDIA</b><b class='flag-5'>系统</b>

    科技成功通过CMMM级认证

    近日,中国电子技术标准化研究院公布了通过CMMM评估专家复核的企业名单。深圳壹科技股份有限公司(以下简称:壹科技)凭借卓越的智能制造体系建设成果,成功通过CMMM级认证,正式迈入智能制造集成级企业行列。
    的头像 发表于 09-11 15:38 493次阅读

    直播回顾 | TARA实践与应用,干货都在这

    概述随着汽车智能化和网联化的发展,电子系统日益复杂,网络安全问题愈发突出。威胁分析与风险评估(TARA)方法作为系统性应对这些挑战的关键工具,其重要性不言而喻。近日,磐时网络安全负责人王仲宇老师亮相
    的头像 发表于 09-05 16:15 237次阅读
    直播回顾 | TARA实践与应用,干货<b class='flag-5'>都在这</b>!

    NVIDIA助力Axio团队打造全新DPU数据面开发框架

    在第NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 08-30 15:58 1177次阅读

    汽车导航系统EMC整改:工程师必看,成本降低40%的秘诀

    南柯电子|汽车导航系统EMC整改:工程师必看,成本降低40%的秘诀
    的头像 发表于 07-22 11:07 463次阅读

    水表界的“翻译官”:让CCLinkIE和Modbus TCP“无障碍聊天”!

    CCLinkIE系统时,丢包率高达5%,通信频繁“掉线”。工程师启用耐达讯通信技术网关后,上演“抢救三连” 缩短更新周期:将数据刷新时间从1秒改为500毫秒,减少延迟; 排查IP冲突:调整网络地址分配,避免“地址
    发表于 07-10 15:43

    国芯科技与均安全达成战略合作

    近日,苏州国芯科技股份有限公司(以下简称“国芯科技”,证券代码:688262)与宁波均电子股份有限公司(证券简称:均电子,证券代码:600699)的子公司均汽车安全系统(上海)有
    的头像 发表于 06-20 16:21 1565次阅读

    NVIDIA DPU黑客松开启报名

    NVIDIA DPU 中国虚拟黑客松(Hackathon)将于 6 月 28 日 - 6 月 30 日正式开启!作为备受广大开发者期待的年度赛事,它将提供与 NVIDIA 加速网络技术深度
    的头像 发表于 05-27 10:16 762次阅读

    NVIDIA发布AI优先DGX个人计算系统

    NVIDIA 宣布,多家行业领先系统制造商将打造 NVIDIA DGX Spark。
    的头像 发表于 05-22 09:39 841次阅读

    如何在Ubuntu上安装NVIDIA显卡驱动?

    Memory:16G GPU:NVIDIA Geforce RTX4060 系统:Ubuntu 24.04 ,安装前的准备工作 在开始安装NVIDIA驱动前,需要做好
    的头像 发表于 05-07 16:05 2116次阅读
    如何在Ubuntu上安装<b class='flag-5'>NVIDIA</b>显卡驱动?

    TF-SAW 专利铁幕落下,卓微遭遇诉讼五

    “卓微”)发起专利侵权起诉,指控其 MAX - SAW 滤波器(业界普遍称为TF-SAW)侵犯了村田(Murata)的五项核心专利。 滤波器作为现代通信系统中的关键部件,承担着过滤掉不必要信号频段的重任,确保通信设备能在特定频段内正常工作。常见的滤波器类型包括 SAW
    发表于 04-18 09:16 768次阅读

    TF-SAW 专利铁幕落下,卓微遭遇诉讼五发​

    “卓微”)发起专利侵权起诉,指控其 MAX - SAW 滤波器侵犯了村田(Murata)的五项核心专利。​ 滤波器作为现代通信系统中的关键部件,承担着过滤掉不必要信号频段的重任,确保通信设备能在特定频段内正常工作。常见的滤波器类型包括 SAW(表面声波滤波器)、BAW
    发表于 04-17 08:01 708次阅读

    集团与NVIDIA建立战略合作伙伴关系

    集团,全球最大的连锁餐厅,也是肯德基、Taco Bell、必胜客和 Habit Burger& Grill 的母公司,正在通过 NVIDIA AI 技术加速 AI 部署,以优化订单处理、提升运营效率并改善餐厅服务体验。
    的头像 发表于 03-27 09:20 1148次阅读

    浙江大学陈红/钱超团队探讨智能超材料与超材料智能的重大进展

        导读 近日,浙江大学陈红教授团队联合以色列理工学院Ido Kaminer教授团队以“A guidance to intelligent metamaterials
    的头像 发表于 02-14 09:37 1239次阅读
    浙江大学陈红<b class='flag-5'>胜</b>/钱超<b class='flag-5'>团队</b>探讨智能超材料与超材料智能的重大进展

    NVIDIA CES 2025汽车行业回顾

    NVIDIA 中国推出的人工智能类音频节目再次开讲啦,在这里,你将与 NVIDIA 共同见证人工智能的磅礴力量与无限可能!
    的头像 发表于 01-21 09:59 858次阅读