0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美团借助NVIDIA A100 GPU降低成本

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-01-24 10:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

基于深度学习的系统可以为数十亿在线消费者提高推荐内容的相关性。

在过去十年中,全球电子商务的价值已飙升到数万亿美元,为数十亿消费者提供服务。促进在线销售实现这种爆炸式增长的动力,是由推荐系统引擎驱动的个性化。

推荐系统能够使购物更加个性化。在电子商务网站上搜索产品时,他们会捕捉搜索,或者单纯显示建议。互联网上之所以能提供这种令人愉悦的体验,依托的是规模日益庞大的数据集和模型。

NVIDIA Merlin 是推荐系统的助推器。它能够提高训练和推理速度,使各种类型的企业均能够更好地利用数据来构建由 NVIDIA GPU 加速的推荐系统。

在线交易的风险比以往更高。根据 eMarketer 发布的数据,2021 年全球在线销售额预计达到近 5 万亿美元,比上一年增加近 17%。

在一些全球大型在线网站上,即使推荐内容的相关性仅提高 1%,其销量也会增加数十亿。

投资于推荐系统已成为当今互联网巨头的主要竞争优势之一。

根据 Mordor Intelligence 发布的数据,在 2026 年,推荐系统整体市场将从2020 年仅为 21.2 亿美元提升至 151.3 亿美元。而这家研究公司同时也表示,在推荐系统引擎的细分市场中,规模更庞大、发展更迅速的市场就在亚太地区。

但是,本行业所面临的挑战是,提高相关性需要更多的数据和更高的处理能力。这些数据包含数十亿产品和消费者档案上数以万亿计的用户及产品交互(点击、浏览)。

这种规模的数据可能需要数天时间来完成模型训练。然而,越快推出基于更多数据的新模型,其相关性也就会越高。

Merlin 的模型、方法和库集合包括用于构建基于深度学习的系统的工具,能够处理 TB 级的数据,以便提供更精准的预测并增加点击量。

SNAP 利用 Merlin 和 GPU 提升推理

根据 eMarketer 发布的数据,2021 年美国数字广告收入预计达到 1911 亿美元,比上一年增长 25.5%。

Snap 是社交媒体应用 Snapchat 的母公司,位于加利福尼亚州圣塔莫尼卡,日活跃用户量已超过 3 亿。该公司通过社交照片和视频信息服务来创造广告收入。

Snap 首席执行官 Evan Spiegel 在其第三季度利润表中表示:“我们将继续专注于为广告合作伙伴提供强劲的业绩结果,通过创新来扩展平台功能并更好地为社区服务。”

Snap 的技术障碍在于,力图继续开发其工作负载的高成本排名模型,并在降低成本的同时扩展到更复杂的模型。

该公司使用 NVIDIA GPU 和 Merlin 来提升其内容排名能力。

Snap 工程副总裁 Nima Khajehnouri 说:“Snap 使用 NVIDIA GPU 和 Merlin 软件将机器学习推理成本效益提高了 50%,且降低 2 倍的服务延迟,其能够为试验和部署更繁重、更准确的广告和内容排名模型,提供更大的计算空间。”

腾讯借助 Merlin HugeCTR 来推动模型训练

娱乐行业巨头腾讯是中国一家具有高额市值的大型公司,运营着广受欢迎的信息服务——微信,以及支付平台——微信支付。

工程师需要快速对广告推荐系统的模型进行快速迭代,这会增加对训练性能的需求。

腾讯专家工程师孔祥挺说:“广告业务是腾讯内部比较重要的业务之一,而推荐系统则用来提高整体的广告收入。”

问题在于,广告推荐的准确性只有通过训练更多的样本数据(包括更多的样本特征)来提高,但这会延长训练时间,从而影响模型更新频率。

他还说道:“作为一个推荐系统的训练框架,HugeCTR 已集成到广告推荐训练系统中,使得模型训练的更新频率更快,并通过训练更多的样本来提升线上广告效果。”

他补充道,模型的训练性能得到提升后,我们就可以训练更多的数据,提高模型的准确率,从而增加广告收入。

美团借助 NVIDIA A100 GPU 降低成本

美团的业务涵盖 200 个服务类别,在食品、娱乐和按需服务各领域高度交织着。而这家中国互联网巨头拥有超过 6.67 亿活跃用户和 830 万活跃商家。

美团高级技术专家黄军表示,如果他的团队要大幅提升性能,通常会更倾向于训练更多的样本和更复杂的模型。

黄军也表示,美团的问题在于,随着模型变得越来越复杂,对训练框架进行深入优化就会变得困难。

他说道:“我们正致力于将 NVIDIA HugeCTR 集成到基于 A100 GPU 的训练系统中。”成本也会大大降低。这还仅仅只是初步的优化结果,未来还有很大的优化空间。”

美团最近报告说,在 2021 年第二季度的过去 12 个月中,每位交易用户的平均交易量增加到 32.8 笔,而在 2020 年第二季度的过去 12 个月中为 25.7 笔。

原文标题:为数十亿消费者提供服务:NVIDIA Merlin 助力网络巨头获得点击量

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5687

    浏览量

    110112
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136062
  • 互联网
    +关注

    关注

    55

    文章

    11350

    浏览量

    110452

原文标题:为数十亿消费者提供服务:NVIDIA Merlin 助力网络巨头获得点击量

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NCP1215A低成本可变关断时间开关电源控制器的深度解析

    NCP1215A低成本可变关断时间开关电源控制器的深度解析 在电源设计领域,如何在满足性能要求的同时降低成本、减小尺寸和重量,是工程师们一直面临的挑战。NCP1215A作为一款专为低
    的头像 发表于 04-11 12:15 241次阅读

    群联电子创新推出Hybrid方案,助力客户降低成本降低AI应用门槛

    电子发烧友网报道(文/李弯弯)在AI浪潮席卷全球的当下,存储产业正深陷多重困境:供需矛盾日益尖锐,产业价值重心加速上移,高端存储供给瓶颈凸显,价格下行缺乏支撑,成本压力如影随形。与此同时,AI发展
    的头像 发表于 04-10 09:09 6352次阅读

    Vishay推出车规级光伏MOSFET驱动器,提升高压系统可靠性并降低成本

    。Vishay Semiconductors VODA1275专门用来提升高压车载应用的安全性和可靠性,同时简化设计并降低成本,器件导通时间、开路电压和短路电流均达到业内先进水平。 日
    的头像 发表于 04-01 15:48 457次阅读

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的
    的头像 发表于 02-10 10:31 517次阅读

    低成本高精度:组合导航系统如何重塑现代精准农业

    在当今的农业生产中,精准农业已不再是遥远的概念,而是提升效率、降低成本、实现可持续发展的关键路径。
    的头像 发表于 02-01 11:11 1448次阅读

    MAX98357A/MAX98357B:低成本PCM D类放大器的卓越之选

    MAX98357A/MAX98357B:低成本PCM D类放大器的卓越之选 在电子设备的音频放大领域,如何在保证音质的同时降低成本、减小尺寸一直是工程师们追求的目标。Maxim Integrated
    的头像 发表于 01-16 15:55 655次阅读

    禾赛科技与无人机达成战略合作

    2025 年 12 月 19 日,全球激光雷达领导者禾赛科技(NASDAQ: HSAI;HKEX: 2525)宣布与无人机达成战略合作,禾赛第二代纯固态感知定位激光雷达 FTX 正式获得
    的头像 发表于 12-29 14:14 4730次阅读

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GP
    的头像 发表于 12-13 10:12 1418次阅读
    在Python中<b class='flag-5'>借助</b><b class='flag-5'>NVIDIA</b> CUDA Tile简化<b class='flag-5'>GPU</b>编程

    新手小白必看!关于A100云主机租用,你想知道的一切都在这!

    “我想租一台A100云主机来跑我的模型,但完全不知道从何下手。”——这是我们听到最多的来自AI新手的声音。A100,这个听起来就“高大上”的名词,背后其实是一套清晰、可操作的流程。今天,我们就用
    的头像 发表于 10-31 19:24 1973次阅读
    新手小白必看!关于<b class='flag-5'>A100</b>云主机租用,你想知道的一切都在这!

    DGX A100服务器出故障?选对维修商,帮你省心又省钱!

    企业级GPU服务器已成为企业核心生产力的关键支撑。然而,这些高性能设备一旦出现故障,将对企业的业务运营造成重大影响。尤其是高端的DGXA100服务器,其复杂的技术架构和高昂的维修成本,让许多企业在
    的头像 发表于 10-24 19:05 469次阅读
    DGX <b class='flag-5'>A100</b>服务器出故障?选对维修商,帮你省心又省钱!

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4351次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    优化电能计量中隔离式电流检测的信号链成本与精度

    和风能等可再生能源的普及,能源计量设备需提供更精细的功耗数据以优化使用和降低成本。应用包括智能电表、EV充电桩、电源分配单元、智能家电、路灯和楼宇自动化。成本压力与区域标准(如 ANSI C12、欧盟
    发表于 08-19 17:18

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 1638次阅读

    泰国零售巨头 CJ Express 借助 SAP 内存数据库实现高效数据管理

    泰国零售和食品分销商 CJ Express 借助 SAP 内存数据库及 Datavard 解决方案,有效控制数据增长,提升系统性能并降低成本的成功案例。
    的头像 发表于 06-13 11:04 736次阅读
    泰国零售巨头 CJ Express <b class='flag-5'>借助</b> SAP 内存数据库实现高效数据管理

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPUNVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDI
    的头像 发表于 05-27 13:59 1272次阅读