0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

想你所想:推荐系统团队建议获胜策略

西西 来源:厂商供稿 作者:NVIDIA 2021-07-21 14:55 次阅读

在应对重大行业挑战方面拥有大量成功经验的NVIDIA 专家分享了打造出色推荐系统的制胜诀窍。

“三连胜”之战已经到了最后的冲刺关头。

在截止时间前五分钟,这支团队提交了竞赛作品,这是今年第三次也是难度最高的一次推荐系统数据科学竞赛。它叫做 RecSys,是计算机科学一个相对较新的分支,它催生了机器学习领域常用的应用程序之一,这一程序帮助数百万人找到他们想看、想买和想玩的内容。

该团队共使用了六个 AI 模型,达到了比赛规定的 20 千兆字节上限,所有这些模型都是根据他们研究 7.5 亿个数据点的经验精挑细选出来的。这次比赛有一项不同寻常的规则,要求模型必须基于一个云端 CPU 的单一内核运行,并且运行时间不能超过 24 小时。

他们按下了提交按钮,静静等待。

23 小时 40 分钟后,一封电子邮件送来捷报:他们位列榜首。

紧扣截止时间

根据 6 月 28 日正式宣布的比赛结果,这支由七人组成的NVIDIA 参赛团队第二次赢得ACM RecSys 2021 挑战赛。

“这封电子邮件的到来可以说是紧扣截止时间 – 如果再晚 20 分钟,我们就超出 24 小时的运行时间了,”Chris Deotte 说道,他是参赛小组的成员之一,也是被视为线上数据科学界的奥林匹克的卡格尔比赛的大师级人物。

“我们当时真的很紧张,”Benedikt Schifferer 说,他是帮助设计NVIDIA Merlin框架的团队成员之一,该框架可以帮助用户快速建立自己的推荐系统。

GPU 本可以在很短的时间内完成推理工作。这支团队中常驻巴西的卡格尔比赛大师 Gilberto Titericz 表示,让推理工作去适应 CPU 核心“就好像回到了远古时代”。

事实上,比赛一结束,该团队就展示了在CPU核心上花费近24小时的推理工作,在单个NVIDIA A100 Tensor Core GPU上运行只需7分钟。

在每天 4 千万个数据点中找出推荐项

在比赛中,Twitter 在 28 天内每天向参与者提供数百万个数据点,并要求他们预测用户会点赞或转推哪些推文。这是这一针对 RecSys 的领先技术会议发起的行业实力挑战,吸引了来自Facebook、Google、Spotify 等公司的优秀工程师

图注:RecSys 挑战团队的部分成员(从左上角开始,按顺时针次序依次为):Bo Liu、Benedikt Schifferer、Gilberto Titericz 和 Chris Deotte。

这个学科领域真的很难,但也非常实用。推荐系统为我们的数字经济提供发展动力,通过比传统搜索更快、更智能的方式提供建议。

行业挑战赛有助于推动这一领域的发展,让每个人都能从中受益,不论他们是在为配偶寻找完美的礼物,还是尝试在网上寻找一位老朋友。

五个月,三连胜

今年早些时候,NVIDIA 团队在 Booking.com 挑战赛的 40 支参赛小组中拨得头筹。他们使用数百万个匿名数据点来准确的预测了欧洲度假者最终将选择前往的城市。

今年 6 月,另一项顶级 RecSys 大赛SIGIR 电子商务数据挑战赛设置了更高的门槛。

信息检索特别兴趣小组 SIGIR 的年度会议吸引了来自阿里巴巴和沃尔玛实验室的专家。其 2021 年挑战赛提供了 3700 万个在线购物会话的数据点,并要求参赛者预测用户会购买哪些产品

由于这场比赛与 ACM RecSys挑战赛的时间重叠,NVIDIA 团队不得不兵分两路,各有侧重地参与不同的比赛。一些团队成员在此压力下正埋头为 ACM RecSys 会议撰写论文。

“快攻”艺术

其中一只NVIDIA团队共包含五名成员,分别身处巴西、加拿大、法国和美国在每个排行榜中这只团队均排名第一或第二。能取得这样出色的整体表现,主要有两个因素。其一,他们在 Transformer 模型上下了很大功夫,这些模型是为自然语言处理开发的,并越来越多地被 RecSys所采用。其二,他们深谙轮班工作的工作方法。“在一名成员将要入睡时,另一名身处不同时区的成员就可以接手工作,”Merlin 团队负责人 Even Oldridge 说。

“在一切顺利时,这种做法非常有效,我很惊讶我们在过去一年中取得的成就,这不但培养了我们的内部知识,也树立了我们在 RecSys 社区中的地位,让我们能够在 5 个月内赢得三场重要比赛。”

尊重用户隐私

这项比赛要求模型在对用户没有任何背景了解的情况下对用户进行预测,参赛者对于用户的所知仅限于其当前浏览会话。

位于圣保罗的领导 NVIDIA SIGIR 团队的 Merlin 资深研究员 Gabriel Moreira表示:“这是一项重要的任务,因为有时用户希望匿名浏览,并且一些隐私法限制了对于用户历史信息的访问。”

这场比赛标志着该团队首次在挑战赛的关键部分只使用 Transformer 模型。Moreira 的团队致力于让每一位 Merlin 客户更轻松地获享庞大的神经网络

从三连胜到四连胜

6 月 30 日,NVIDIA在 RecSys 挑战赛取得四连胜。行业基准组织 MLPerf 宣布,NVIDIA及 其合作伙伴在其所有最新训练基准测试中均创下新纪录,其中包括一个有关推荐系统的基准测试。

参赛团队描述了他们取得的成果——即在不到一分钟内训练基于 14 个NVIDIA DGX系统的推荐系统,与一年前提交的成果相比,速度加快了 3.3 倍。

分享经验心得

这些竞赛激发了新技术的创意,这些新技术被纳入像 Merlin 这样的 RecSys 框架,以及NVIDIA 深度学习学院所拥有的相关工具、论文和在线课程。以达到最终目标:帮助每个人取得成功。

在采访中,NVIDIA 的 RecSys 专家自由地分享了他们的技术诀窍 – 一半是艺术,一半是科学。

关于如何打造出色 RecSys 的专业小贴士

一种最佳实践是使用多种模型,并使其协同工作。

在 ACM RecSys 挑战赛中,团队同时使用了树状和神经网络模型。一个阶段的输出成为了下一个阶段的输入,这一过程称为推叠。

NVIDIA 卡格尔比赛大师团队的新成员 Bo Liu 表示:“单个模型可能会因为数据错误或收敛问题而出错,但如果把几个模型结合起来,那么力量就会无比强大。”

在线结识 Recsys 专家

7 月 29 日,可以在线结识来自 Facebook、NVIDIA 和 TensorFlow 的RecSys 专家,进一步了解如何创建出色的推荐系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4599

    浏览量

    101791
  • 推荐系统
    +关注

    关注

    1

    文章

    42

    浏览量

    10035
收藏 人收藏

    评论

    相关推荐

    基于结构微流体创新的谱系细胞单克隆自动化获取策略

    近期,中国科学院广州健康院张骁研究员团队提出一种基于结构微流体创新的谱系细胞单克隆自动化获取策略
    的头像 发表于 04-22 17:13 356次阅读
    基于结构微流体创新的谱系细胞单克隆自动化获取<b class='flag-5'>策略</b>

    鸿蒙原生应用/元服务实战-AGC团队账户

    多人及内外结合去开发运营鸿蒙原生应用元服务时,需要用到团队账户,AGC提供了强大的团队角色与权限分工能力。 团队帐号是开发者联盟为实名开发者提供的多个成员帐号登录与权限管理服务。当前团队
    发表于 01-18 16:38

    redis的淘汰策略

    Redis是一种基于内存的键值存储系统,为了充分利用内存,Redis采用了一些淘汰策略来管理内存空间。淘汰策略的作用是当内存空间不足时,选择合适的数据对象进行淘汰,释放出更多的内存空间,以供后续
    的头像 发表于 12-04 16:23 321次阅读

    SMT钢网开孔设计与DFM建议

    本文涵盖模块类的钢网开孔设计与DFM建议、BGA类的钢网开孔设计与DFM建议、有外延脚的器件的钢网开孔设计与DFM建议等内容。希望您在阅读本文后有所收获,欢迎在评论区发表您的想法。
    的头像 发表于 11-20 11:47 423次阅读
    SMT钢网开孔设计与DFM<b class='flag-5'>建议</b>

    想你所想,Prisemi芯导推出高集成度低功耗TWS耳机充电全新解决方案

    想你所想,Prisemi芯导推出高集成度低功耗TWS耳机充电全新解决方案
    的头像 发表于 11-01 14:55 237次阅读
    <b class='flag-5'>想你</b><b class='flag-5'>所想</b>,Prisemi芯导推出高集成度低功耗TWS耳机充电全新解决方案

    SELinux策略语言是什么

    SELinux策略语言 SELinux架构中,对于内核资源,策略通过策略管理接口载入SELinux LSM模块安全服务器中,从而决定访问控制。 SELinux的优势是其策略规则不是静态
    的头像 发表于 10-31 14:58 312次阅读
    SELinux<b class='flag-5'>策略</b>语言是什么

    什么是策略模式

    不同的场景,使用不同的策略进行处理。 优点 算法可以自由切换。 避免使用多重条件判断。 扩展性良好。 缺点 策略类会增多。 所有策略类都需要对外暴露。 使用场景 如果在一个系统里面有许
    的头像 发表于 10-08 14:15 1839次阅读
    什么是<b class='flag-5'>策略</b>模式

    浅谈PCB布线设计策略

    。在本文中,我们将讨论自动布线功能的正确使用和错误使用,有无地平面时电流回路的设计策略,以及对双面板元件布局的建议
    发表于 09-26 09:41 450次阅读
    浅谈PCB布线设计<b class='flag-5'>策略</b>

    怎样使用智能系统策略管理EV辅助电池呢?

    一种“智能”系统策略可以确保电动汽车无论处于运行或停泊状态时,其辅助电池都具有足够的能量以满足基本负载需求。
    发表于 08-23 09:13 178次阅读
    怎样使用智能<b class='flag-5'>系统</b><b class='flag-5'>策略</b>管理EV辅助电池呢?

    BICV与Apple认证团队紧密合作 助力进一步完善CarPlay新测试系统

    近日,北斗星通智联科技有限责任公司(简称BICV)应Apple认证团队邀请,成为业内Apple CarPlay新测试认证系统的首批试用单位。 BICV与Apple认证团队,在CarPlay
    的头像 发表于 08-18 09:28 1324次阅读

    OLED透明屏费用降低策略:行业专家分享的实用建议

    OLED透明屏的费用是购买和应用该技术时需要考虑的重要因素。通过深入了解费用构成和降低策略,企业和个人可以更好地规划预算、选择合适的产品,并最大程度地降低费用。在未来,随着技术的进步和市场的竞争,相信OLED透明屏的费用会进一步下降,为更多人带来便利和机遇。
    的头像 发表于 08-17 09:57 262次阅读
    OLED透明屏费用降低<b class='flag-5'>策略</b>:行业专家分享的实用<b class='flag-5'>建议</b>

    谈一谈开发团队代码质量如何管控与提升

    在技术行业做了一定时间的人应该都知道code review是多么的重要,一可以促进团队人员之间互相交流,二可以提升整体团队的技术水平,学习优秀人员写的代码,帮助初级人员提升代码编写能力,所以code review还是强烈必须要做的,至于怎么做code review?我谈一
    的头像 发表于 07-16 15:39 342次阅读

    浅析智能电能表预付费管理系统的费控策略

    摘要:基于智能电能表的预付费系统平台可以实现对预付费客户的适时算费、远程费控和服务。预付费系统的费控策略包括算费子策略、催费预警提醒子策略
    的头像 发表于 07-03 11:29 395次阅读
    浅析智能电能表预付费管理<b class='flag-5'>系统</b>的费控<b class='flag-5'>策略</b>

    【野火 fireFlasher Mini 脱机烧录器】改进设想和建议

    在手机上接收烧录状态信息和发送烧录命令。 三、几点建议 1、比较好实现的是,建议在外壳做一个挂扣,避免手持终端设备最容易跌落导致损坏的情况发生; 2、期待着野火团队尽快更新程序,以便支持更多的型号; 3
    发表于 05-24 21:36

    TynecastleTech团队为初学者提供的鱼菜共生系统

    《初学者水培》是团队开始建立自己的水培系统之旅的教科书。他们了解了细菌如何将鱼类排泄物转化为硝酸盐肥料,给植物施肥,以及在这样的系统中可以茁壮成长的鱼类类型。当地水族馆商店的工作人员以及一位园艺专家的家庭成员为那些生长良好的植物
    的头像 发表于 05-08 11:20 566次阅读
    TynecastleTech<b class='flag-5'>团队</b>为初学者提供的鱼菜共生<b class='flag-5'>系统</b>