0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

想你所想:推荐系统团队建议获胜策略

西西 来源:厂商供稿 作者:NVIDIA 2021-07-21 14:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在应对重大行业挑战方面拥有大量成功经验的NVIDIA 专家分享了打造出色推荐系统的制胜诀窍。

“三连胜”之战已经到了最后的冲刺关头。

在截止时间前五分钟,这支团队提交了竞赛作品,这是今年第三次也是难度最高的一次推荐系统数据科学竞赛。它叫做 RecSys,是计算机科学一个相对较新的分支,它催生了机器学习领域常用的应用程序之一,这一程序帮助数百万人找到他们想看、想买和想玩的内容。

该团队共使用了六个 AI 模型,达到了比赛规定的 20 千兆字节上限,所有这些模型都是根据他们研究 7.5 亿个数据点的经验精挑细选出来的。这次比赛有一项不同寻常的规则,要求模型必须基于一个云端 CPU 的单一内核运行,并且运行时间不能超过 24 小时。

他们按下了提交按钮,静静等待。

23 小时 40 分钟后,一封电子邮件送来捷报:他们位列榜首。

紧扣截止时间

根据 6 月 28 日正式宣布的比赛结果,这支由七人组成的NVIDIA 参赛团队第二次赢得ACM RecSys 2021 挑战赛。

“这封电子邮件的到来可以说是紧扣截止时间 – 如果再晚 20 分钟,我们就超出 24 小时的运行时间了,”Chris Deotte 说道,他是参赛小组的成员之一,也是被视为线上数据科学界的奥林匹克的卡格尔比赛的大师级人物。

“我们当时真的很紧张,”Benedikt Schifferer 说,他是帮助设计NVIDIA Merlin框架的团队成员之一,该框架可以帮助用户快速建立自己的推荐系统。

GPU 本可以在很短的时间内完成推理工作。这支团队中常驻巴西的卡格尔比赛大师 Gilberto Titericz 表示,让推理工作去适应 CPU 核心“就好像回到了远古时代”。

事实上,比赛一结束,该团队就展示了在CPU核心上花费近24小时的推理工作,在单个NVIDIA A100 Tensor Core GPU上运行只需7分钟。

在每天 4 千万个数据点中找出推荐项

在比赛中,Twitter 在 28 天内每天向参与者提供数百万个数据点,并要求他们预测用户会点赞或转推哪些推文。这是这一针对 RecSys 的领先技术会议发起的行业实力挑战,吸引了来自Facebook、Google、Spotify 等公司的优秀工程师

图注:RecSys 挑战团队的部分成员(从左上角开始,按顺时针次序依次为):Bo Liu、Benedikt Schifferer、Gilberto Titericz 和 Chris Deotte。

这个学科领域真的很难,但也非常实用。推荐系统为我们的数字经济提供发展动力,通过比传统搜索更快、更智能的方式提供建议。

行业挑战赛有助于推动这一领域的发展,让每个人都能从中受益,不论他们是在为配偶寻找完美的礼物,还是尝试在网上寻找一位老朋友。

五个月,三连胜

今年早些时候,NVIDIA 团队在 Booking.com 挑战赛的 40 支参赛小组中拨得头筹。他们使用数百万个匿名数据点来准确的预测了欧洲度假者最终将选择前往的城市。

今年 6 月,另一项顶级 RecSys 大赛SIGIR 电子商务数据挑战赛设置了更高的门槛。

信息检索特别兴趣小组 SIGIR 的年度会议吸引了来自阿里巴巴和沃尔玛实验室的专家。其 2021 年挑战赛提供了 3700 万个在线购物会话的数据点,并要求参赛者预测用户会购买哪些产品。

由于这场比赛与 ACM RecSys挑战赛的时间重叠,NVIDIA 团队不得不兵分两路,各有侧重地参与不同的比赛。一些团队成员在此压力下正埋头为 ACM RecSys 会议撰写论文。

“快攻”艺术

其中一只NVIDIA团队共包含五名成员,分别身处巴西、加拿大、法国和美国在每个排行榜中这只团队均排名第一或第二。能取得这样出色的整体表现,主要有两个因素。其一,他们在 Transformer 模型上下了很大功夫,这些模型是为自然语言处理开发的,并越来越多地被 RecSys所采用。其二,他们深谙轮班工作的工作方法。“在一名成员将要入睡时,另一名身处不同时区的成员就可以接手工作,”Merlin 团队负责人 Even Oldridge 说。

“在一切顺利时,这种做法非常有效,我很惊讶我们在过去一年中取得的成就,这不但培养了我们的内部知识,也树立了我们在 RecSys 社区中的地位,让我们能够在 5 个月内赢得三场重要比赛。”

尊重用户隐私

这项比赛要求模型在对用户没有任何背景了解的情况下对用户进行预测,参赛者对于用户的所知仅限于其当前浏览会话。

位于圣保罗的领导 NVIDIA SIGIR 团队的 Merlin 资深研究员 Gabriel Moreira表示:“这是一项重要的任务,因为有时用户希望匿名浏览,并且一些隐私法限制了对于用户历史信息的访问。”

这场比赛标志着该团队首次在挑战赛的关键部分只使用 Transformer 模型。Moreira 的团队致力于让每一位 Merlin 客户更轻松地获享庞大的神经网络

从三连胜到四连胜

6 月 30 日,NVIDIA在 RecSys 挑战赛取得四连胜。行业基准组织 MLPerf 宣布,NVIDIA及 其合作伙伴在其所有最新训练基准测试中均创下新纪录,其中包括一个有关推荐系统的基准测试。

参赛团队描述了他们取得的成果——即在不到一分钟内训练基于 14 个NVIDIA DGX系统的推荐系统,与一年前提交的成果相比,速度加快了 3.3 倍。

分享经验心得

这些竞赛激发了新技术的创意,这些新技术被纳入像 Merlin 这样的 RecSys 框架,以及NVIDIA 深度学习学院所拥有的相关工具、论文和在线课程。以达到最终目标:帮助每个人取得成功。

在采访中,NVIDIA 的 RecSys 专家自由地分享了他们的技术诀窍 – 一半是艺术,一半是科学。

关于如何打造出色 RecSys 的专业小贴士

一种最佳实践是使用多种模型,并使其协同工作。

在 ACM RecSys 挑战赛中,团队同时使用了树状和神经网络模型。一个阶段的输出成为了下一个阶段的输入,这一过程称为推叠。

NVIDIA 卡格尔比赛大师团队的新成员 Bo Liu 表示:“单个模型可能会因为数据错误或收敛问题而出错,但如果把几个模型结合起来,那么力量就会无比强大。”

在线结识 Recsys 专家

7 月 29 日,可以在线结识来自 Facebook、NVIDIA 和 TensorFlow 的RecSys 专家,进一步了解如何创建出色的推荐系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109118
  • 推荐系统
    +关注

    关注

    1

    文章

    44

    浏览量

    10406
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    医疗电子EMC整改:原理到实战的系统化全攻略策略

    深圳南柯电子|医疗电子EMC整改:原理到实战的系统化全攻略策略
    的头像 发表于 11-27 09:45 227次阅读

    嵌入式开发工具版本的选择策略

    兼容性测试标准过渡期支持策略 二、可灵活选择软件版本,但建议统一 有些工具,它对项目的“依耐性”不强,基本上不同版本之间都能用,团队之间可以不用统一软件版本。 比如J-Link 、ST-Link等这种
    发表于 11-25 06:11

    中国科研团队发布稀土材料最新成果

    电致发光这一世界难题。 据悉,科研团队开创性地提出有机半导体敏化策略,以功能化有机配体作为“光电桥梁”,成功将能量精准高效地传递给绝缘稀土纳米晶,实现了电流驱动下的高效发光。
    的头像 发表于 11-24 14:25 388次阅读

    大功率电磁兼容整改:技术原理到实战策略系统化方案

    南柯电子|大功率电磁兼容整改:技术原理到实战策略系统化方案
    的头像 发表于 11-10 09:59 306次阅读

    提高土压力监测数据质量的策略建议

    确保土压力监测数据的准确性和可靠性需要从仪器选型、安装埋设、数据管理和分析应用等环节进行全面优化。以下是一系列提高数据质量的具体策略建议。一、仪器选型与设计优化选择适合的仪器是保证监测质量
    的头像 发表于 11-03 16:40 394次阅读
    提高土压力监测数据质量的<b class='flag-5'>策略</b>与<b class='flag-5'>建议</b>

    介电温谱测试系统中的温度漂移抑制策略

    在介电温谱测试系统中,温度漂移显著影响测试精度。 介电温谱测试系统中的温度漂移抑制策略 在介电温谱测试系统中,温度漂移是影响测试精度的关键因素,会干扰测量结果、掩盖材料真实特性。因此,
    的头像 发表于 07-29 13:29 542次阅读
    介电温谱测试<b class='flag-5'>系统</b>中的温度漂移抑制<b class='flag-5'>策略</b>

    线控转向直流无刷电机的控制策略研究

    【摘要】建立了线控转向系统机械路感模拟和直流无刷电机的数学模型。针对线控转向系统需要直流无刷电机响应快、鲁性高的要求,采用双闭环控制策略,其中电流环采用PID控制,转角环采用滑膜变结构控制。通过
    发表于 07-15 15:22

    安科瑞智能预付费系统费控策略:账户管理与充值功能初探

    的同时,实现资金快速回收,以便于实现预付费客户远程费控和服务。由于智能电能表预付费系统自身特性,所选择的费控策略包括欠费停电子策略、催费预警提醒子策略和算费子
    的头像 发表于 07-08 10:20 412次阅读
    安科瑞智能预付费<b class='flag-5'>系统</b>费控<b class='flag-5'>策略</b>:账户管理与充值功能初探

    三相电机驱动系统逆变器故障补救与容错策略

    的薄弱环节中。因此,实施逆变器的故障诊断、故障离、故障补救与容错策略是提高电机驱动系统安全性的有效途径。电机容错驱动是指通过对系统故障进行实时诊断和分析,在发生故障后主动重构系统的软硬
    发表于 06-12 14:01

    电机大范围调速的综合电压调制策略

    针对电动汽车要求驱动电机具有大范围调速要求和目前任何单种基本调制方式都无法做到全调制比范围内性能最优的问题,提出了一种综合的调制策略:在低调制比阶段使用传统的SVPWM策略,在高调制比阶段
    发表于 04-01 14:51

    永磁同步电机矢量控制策略分析

    本文通过矢量控制策略采用 id=0 控制方案快速准确地控制转矩,实现调速系统具有较高的动态性能。并利用了 Matlab 工具对永磁同步电机矢量控制系统在空载起动、转速突变、负载突变进行了仿真研究。 点击附件可直接打开查看全文*附
    发表于 03-20 12:57

    浅谈电力光伏混合储能系统的能量策略研究

    本文提出了一种针对电源系统的灵活电源管理策略,可以在含有电池转换器和光伏逆变器的系统中*效地使用。该能量管理策略能够充分利用电力系统中组合架
    的头像 发表于 03-07 13:55 710次阅读
    浅谈电力光伏混合储能<b class='flag-5'>系统</b>的能量<b class='flag-5'>策略</b>研究

    嵌入式系统存储的软件优化策略

    会存在镜像不兼容风险。 ·NAND的布局控制是由CPU管理,对应的分区管理和逻辑定制会有很大的灵活性,根据实际应用场景制定不同的管理策略。 ·NAND单位存储寿命较长。 综上,产品存储选型建议使用带有
    发表于 02-28 14:17

    GeneSiC MOSFETs的PCB布局建议

    电子发烧友网站提供《GeneSiC MOSFETs的PCB布局建议.pdf》资料免费下载
    发表于 01-24 13:55 1次下载
    GeneSiC MOSFETs的PCB布局<b class='flag-5'>建议</b>

    光伏储能发电运维系统及能量管理策略研究

    安科瑞徐赟杰18706165067 摘要: 本研究旨在探讨光伏储能发电系统的性能优化和能量管理策略的发展。随着可再生能源的需求不断增加,光伏储能系统作为一种具有巨大潜力的能源解决方案备受瞩目。然而
    的头像 发表于 01-21 13:14 1312次阅读
    光伏储能发电运维<b class='flag-5'>系统</b>及能量管理<b class='flag-5'>策略</b>研究