0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美团借助NVIDIA A100 GPU降低成本

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-01-24 10:15 次阅读

基于深度学习的系统可以为数十亿在线消费者提高推荐内容的相关性。

在过去十年中,全球电子商务的价值已飙升到数万亿美元,为数十亿消费者提供服务。促进在线销售实现这种爆炸式增长的动力,是由推荐系统引擎驱动的个性化。

推荐系统能够使购物更加个性化。在电子商务网站上搜索产品时,他们会捕捉搜索,或者单纯显示建议。互联网上之所以能提供这种令人愉悦的体验,依托的是规模日益庞大的数据集和模型。

NVIDIA Merlin 是推荐系统的助推器。它能够提高训练和推理速度,使各种类型的企业均能够更好地利用数据来构建由 NVIDIA GPU 加速的推荐系统。

在线交易的风险比以往更高。根据 eMarketer 发布的数据,2021 年全球在线销售额预计达到近 5 万亿美元,比上一年增加近 17%。

在一些全球大型在线网站上,即使推荐内容的相关性仅提高 1%,其销量也会增加数十亿。

投资于推荐系统已成为当今互联网巨头的主要竞争优势之一。

根据 Mordor Intelligence 发布的数据,在 2026 年,推荐系统整体市场将从2020 年仅为 21.2 亿美元提升至 151.3 亿美元。而这家研究公司同时也表示,在推荐系统引擎的细分市场中,规模更庞大、发展更迅速的市场就在亚太地区。

但是,本行业所面临的挑战是,提高相关性需要更多的数据和更高的处理能力。这些数据包含数十亿产品和消费者档案上数以万亿计的用户及产品交互(点击、浏览)。

这种规模的数据可能需要数天时间来完成模型训练。然而,越快推出基于更多数据的新模型,其相关性也就会越高。

Merlin 的模型、方法和库集合包括用于构建基于深度学习的系统的工具,能够处理 TB 级的数据,以便提供更精准的预测并增加点击量。

SNAP 利用 Merlin 和 GPU 提升推理

根据 eMarketer 发布的数据,2021 年美国数字广告收入预计达到 1911 亿美元,比上一年增长 25.5%。

Snap 是社交媒体应用 Snapchat 的母公司,位于加利福尼亚州圣塔莫尼卡,日活跃用户量已超过 3 亿。该公司通过社交照片和视频信息服务来创造广告收入。

Snap 首席执行官 Evan Spiegel 在其第三季度利润表中表示:“我们将继续专注于为广告合作伙伴提供强劲的业绩结果,通过创新来扩展平台功能并更好地为社区服务。”

Snap 的技术障碍在于,力图继续开发其工作负载的高成本排名模型,并在降低成本的同时扩展到更复杂的模型。

该公司使用 NVIDIA GPU 和 Merlin 来提升其内容排名能力。

Snap 工程副总裁 Nima Khajehnouri 说:“Snap 使用 NVIDIA GPU 和 Merlin 软件将机器学习推理成本效益提高了 50%,且降低 2 倍的服务延迟,其能够为试验和部署更繁重、更准确的广告和内容排名模型,提供更大的计算空间。”

腾讯借助 Merlin HugeCTR 来推动模型训练

娱乐行业巨头腾讯是中国一家具有高额市值的大型公司,运营着广受欢迎的信息服务——微信,以及支付平台——微信支付。

工程师需要快速对广告推荐系统的模型进行快速迭代,这会增加对训练性能的需求。

腾讯专家工程师孔祥挺说:“广告业务是腾讯内部比较重要的业务之一,而推荐系统则用来提高整体的广告收入。”

问题在于,广告推荐的准确性只有通过训练更多的样本数据(包括更多的样本特征)来提高,但这会延长训练时间,从而影响模型更新频率。

他还说道:“作为一个推荐系统的训练框架,HugeCTR 已集成到广告推荐训练系统中,使得模型训练的更新频率更快,并通过训练更多的样本来提升线上广告效果。”

他补充道,模型的训练性能得到提升后,我们就可以训练更多的数据,提高模型的准确率,从而增加广告收入。

美团借助 NVIDIA A100 GPU 降低成本

美团的业务涵盖 200 个服务类别,在食品、娱乐和按需服务各领域高度交织着。而这家中国互联网巨头拥有超过 6.67 亿活跃用户和 830 万活跃商家。

美团高级技术专家黄军表示,如果他的团队要大幅提升性能,通常会更倾向于训练更多的样本和更复杂的模型。

黄军也表示,美团的问题在于,随着模型变得越来越复杂,对训练框架进行深入优化就会变得困难。

他说道:“我们正致力于将 NVIDIA HugeCTR 集成到基于 A100 GPU 的训练系统中。”成本也会大大降低。这还仅仅只是初步的优化结果,未来还有很大的优化空间。”

美团最近报告说,在 2021 年第二季度的过去 12 个月中,每位交易用户的平均交易量增加到 32.8 笔,而在 2020 年第二季度的过去 12 个月中为 25.7 笔。

原文标题:为数十亿消费者提供服务:NVIDIA Merlin 助力网络巨头获得点击量

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4585

    浏览量

    101687
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4413

    浏览量

    126637
  • 互联网
    +关注

    关注

    54

    文章

    10896

    浏览量

    100726

原文标题:为数十亿消费者提供服务:NVIDIA Merlin 助力网络巨头获得点击量

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    是德科技5G O-RAN端到端解决方案助力技术创新并降低成本

    2018年,移动通信运营商首次引入开放无线接入网络(O-RAN),旨在利用O-RAN构建多网络设备供应商 体系来增强技术创新并降低成本
    的头像 发表于 03-05 14:38 183次阅读
    是德科技5G O-RAN端到端解决方案助力技术创新并<b class='flag-5'>降低成本</b>

    ZR机械手:提高生产效率,降低成本的有效途径-速程精密

    ZR机械手:提高生产效率,降低成本的有效途径-速程精密 在制造业中,如何提高生产效率、降低成本一直是企业追求的目标。随着科技的不断进步,ZR机械手作为一种新型的自动化设备,逐渐成为实现这一
    的头像 发表于 02-28 15:14 168次阅读
    ZR机械手:提高生产效率,<b class='flag-5'>降低成本</b>的有效途径-速程精密

    电路板pcb打样降低成本的方法

    电路板pcb打样降低成本的方法
    的头像 发表于 12-13 17:25 378次阅读

    对英伟达A100芯片算力服务收费价格上调100%,这家企业的硬气来自哪里?

    半导体芯情了解到,A100是英伟达最新推出的一款高性能计算芯片,采用了全新的Ampere架构,Ampere架构是NVIDIA于 GTC 2020发布的GPU架构,NVIDIA Ampe
    的头像 发表于 11-14 16:30 643次阅读
    对英伟达<b class='flag-5'>A100</b>芯片算力服务收费价格上调<b class='flag-5'>100</b>%,这家企业的硬气来自哪里?

    英伟达a100和h100哪个强?英伟达A100和H100的区别

    英伟达a100和h100哪个强? 就A100和H100这两个产品来说,它们虽然都是英伟达公司的高性能计算产品,但是面向的市场和应用场景不同,所以不能简单地说哪个更强。
    的头像 发表于 08-09 17:31 3.5w次阅读

    英伟达h800和a100的区别

    英伟达h800和a100的区别 NVIDIA H800和A100NVIDIA的两种不同类型的GPU,具有不同的架构和特点。以下是它们之间的
    的头像 发表于 08-08 16:05 1.4w次阅读
    英伟达h800和<b class='flag-5'>a100</b>的区别

    英伟达h800和a100参数对比

    英伟达h800和a100参数对比 NVIDIA H800和A100是两款高端的GPU产品,下面是它们的参数对比: 1.架构: H800采用的是Volta架构,而
    的头像 发表于 08-08 15:53 2.5w次阅读
    英伟达h800和<b class='flag-5'>a100</b>参数对比

    英伟达A100的算力是多少?

    ,但 A100 的算力是前者的 20 倍。 A100是英伟达推出的一款强大的数据中心GPU,采用全新的Ampere架构。它拥有高达6,912个CUDA核心和40GB的高速HBM2显存。可以实现高达
    的头像 发表于 08-08 15:28 2.4w次阅读

    英伟达A100的优势分析

    英伟达A100的优势分析 在大模型训练中,A100是非常强大的GPUA100是英伟达推出的一款强大的数据中心GPU,采用全新的Ampere
    的头像 发表于 08-08 15:25 2648次阅读

    英伟达A100的简介

    英伟达A100的简介 A100都是非常强大的GPU。英伟达A100、A800、H100、V100
    的头像 发表于 08-08 15:17 7577次阅读

    英伟达A100是什么系列?

    英伟达A100是什么系列? 全球都在关注生成式人工智能;特别是OpenAI发布ChatGPT以来,生成式人工智能技术一下就被拔高。在大模型训练中,A100是非常强大的GPU。英伟达的AI芯片这个时候
    的头像 发表于 08-08 15:13 2216次阅读

    英伟达A100和A40的对比

    TFLOPS的FP32浮点性能和156 TFLOPS的深度学习性能。 英伟达A100和A40是英伟达公司推出的两个数据中心加速器。它们都是基于英伟达的Ampere架构设计的最新GPU,支持全新的NVIDIA
    的头像 发表于 08-08 15:08 1.3w次阅读

    英伟达A100和V100参数对比

    宽带。英伟达A100还配备了英伟达的第三代NVLink互连技术和第二代NVSwitch交换机,可以实现高带宽、低延迟的GPU-GPU通信,提升集群中的计算效率
    的头像 发表于 08-08 11:54 9187次阅读
    英伟达<b class='flag-5'>A100</b>和V<b class='flag-5'>100</b>参数对比

    英伟达a100和a800的区别

    Core加速器,而A800则没有。 5. 能效比不同:A100比A800更节能,功耗为400W,而A800为250W。 总的来说,A100在AI计算方面表现更加强大,而A800适用于对GPU计算要求较低的场景。
    的头像 发表于 08-07 17:57 3.2w次阅读

    英伟达a100和h100哪个强?

    架构。 英伟达A100是一款基于最新的NVIDIA Ampere架构设计的数据中心GPU,拥有更多的CUDA核心、更高的时钟频率和更大的存储
    的头像 发表于 08-07 17:32 1.1w次阅读