0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI发布新成果TF-Ranking:基于TensorFlow的可扩展库

DPVg_AI_era 来源:lq 2018-12-08 09:28 次阅读

谷歌AI发布新成果,TF-Ranking:这是一个应用于Learning to Rank、基于TensorFlow的可扩展库。它提供了一个统一的框架,其中包括一套最先进的Learning to Rank算法,并支持成对或列表丢失函数,多项目评分,排名度量优化等等。

排序,是一种适用于搜索引擎、系统推荐以及机器翻译等的重要操作。

在诸如此类的应用程序中,研究人员经常使用一组名叫Learning to Rank的有监督机器学习技术。

在许多情况下,Learning to Rank应用于较大的数据集,在这些场景中,TensorFlow可扩展性是具有优势的。

然而,目前还没有现成的,可以在TensorFlow中应用Learning to Rank的技术。而且也没有其他开源库专门应用大规模Learning to Rank技术。

谷歌AI发布了TF-Ranking,这是一个应用于Learning to Rank、基于TensorFlow的可扩展库。

TF-Ranking

TF-Ranking提供了一个统一的框架,其中包括一套最先进的Learning to Rank算法,并支持成对或列表丢失函数,多项目评分,排名度量优化等等。

TF-Ranking速度较快且易于使用,而且还可以创建高质量的排名模型。统一的框架使ML研究人员、从业者和爱好者能够在单个库中评估和选择一系列不同的排名模型。

此外,谷歌团队坚信一个有用的开源库,其关键不仅在于提供合理的默认值(sensible default),还在于授权用户开发他们自己的定制模型。因此,团队提供了灵活的API,用户可以在API中定义和插入自己定制的损失函数、评分函数和指标。

现有的算法和度量支持

Learning to Rank算法的目标是最小化在项目列表上定义的损失函数,以优化任何给定应用程序的列表排序的效用。TF-Ranking支持广泛的标准pointwise,pairwise和listwise损失函数。这确保了使用TF-Ranking库的研究人员能够复制和扩展以前发布的基线,从业者可以为他们的应用做出最明智的选择。

此外,TF-Ranking可以通过嵌入和扩展到数亿个训练实例来处理稀疏特征(如原始文本)。

因此,任何对构建真实世界数据密集型排名系统(如Web搜索或新闻推荐)感兴趣的人都可以使用TF-Ranking作为强大,可扩展的解决方案。

经验评估是任何机器学习或信息检索研究的重要组成部分。

为了确保与先前工作的兼容性,TF-Ranking支持许多常用的排名指标,包括平均倒数排名(MRR)和归一化折扣累积收益(NDCG)。

TensorBoard中显示的训练步骤(X轴)的NDCG度量(Y轴)的示例。 它显示了训练期间指标的总体进度。 可以直接在仪表板上比较不同的方法。 可以根据指标选择最佳模型。

多项评分

TF-Ranking支持一种新的评分机制,其中多个项目(例如web页面)可以联合评分,这是对传统评分模式的扩展,在传统的评分模式中,单个项目是独立评分的。

多项目评分的一个挑战是很难推断哪些项目必须分组并在子组中评分。然后,每个项目的分数被累积起来,用于排序。为了让这些复杂性对用户透明,TF- Ranking提供了一个List-In-List-Out (LILO) API,将所有这些逻辑包装在导出的TF模型中。

TF-Ranking库支持多项目评分体系结构,是传统单项评分的扩展。

正如谷歌AI在最近的工作中所展示的那样,多项目评分在公共LETOR基准测试中与RankNet,MART和LambdaMART等最先进的学习级别模型相比具有竞争力。

排名指标优化

Learning to Rank一个重要研究挑战是直接优化排名指标(如前面提到的NDCG和MRR)。

这些指标虽然能够比曲线下面积(Area Under the Curve, AUC)之类的标准分类指标更好地衡量排名系统的性能,但很可惜,它们要么不连续,要么平坦(flat)。因此,这些指标的标准随机梯度下降优化是有问题的。

谷歌AI提出了一种新的方法,LambdaLoss,它为排序度量优化提供了一个有原则的概率框架。

在这个框架中,可以通过期望最大化的过程来设计和优化度量驱动的损失函数。TF-Ranking库集成了直接度量优化的最新进展,并提供了LambdaLoss的实现。

无偏(unbiased)Learning to Rank

先前的研究表明,给定一个项目的排序列表,用户更有可能与前几个结果交互,而不会考虑它们的相关性。

这一发现激发了人们对无偏Learning to Rank的研究兴趣,并且基于训练的实例进行重新加权,开发了无偏见的评估和几种无偏见的学习算法。

开始用TF-Ranking吧!

TF-Ranking实现了TensorFlow Estimator接口,通过封装训练、评估、预测和导出服务,大大简化了机器学习编程

TF-Ranking与丰富的TensorFlow生态系统完美集成。 如上所述,你可以使用Tensorboard可视化NDCG和MRR等排名指标,以及使用这些指标选择最佳模型检查点。 一旦你的模型准备就绪,便可以使用TensorFlow服务,非常容易将其部署到生产中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5849

    浏览量

    103246
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130543
  • tensorflow
    +关注

    关注

    13

    文章

    313

    浏览量

    60242

原文标题:谷歌推出TF-Ranking:用于排序算法的可扩展TensorFlow库

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlowTensorFlow是一个开源的机器学习框架,由
    的头像 发表于 03-01 16:25 227次阅读

    谷歌发布全新AI模型Genie

    谷歌近日发布了其全新的AI模型Genie,这一模型彻底改变了我们与数字世界的互动方式。Genie不仅可以接收文本提示、草图或想法,还能将这些创意迅速转化为一个可互动和玩耍的虚拟世界。
    的头像 发表于 02-28 18:25 1131次阅读

    谷歌发布AI基础世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基础世界模型Genie。这一创新技术允许用户通过单张图像提示,生成一个可玩的、交互式的虚拟环境,从而开启了一个全新的数字体验时代。
    的头像 发表于 02-28 17:41 388次阅读

    谷歌发布开源AI大模型Gemma

    近日,谷歌发布了全新AI大模型Gemma,这款模型为各种规模的组织提供了前所未有的机会,以负责任的方式在商业应用中进行分发。
    的头像 发表于 02-28 17:38 401次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06

    谷歌发布最先进的开放模型Gemma

    在 Google,我们致力于让 AI 助力每个人。长期以来,我们对开放社区的创新贡献了许多成果,如 Transformers、TensorFlow、BERT、T5、JAX、AlphaFold
    的头像 发表于 02-23 10:12 255次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>发布</b>最先进的开放模型Gemma

    谷歌发布全新AI SDK,简化安卓应用集成

    谷歌破茧而出,全新发布 Google AI SDK,引领 Android 应用迈向高性能 AI 集成新时代。这次发布的 SDK,专门为 An
    的头像 发表于 01-03 14:18 317次阅读

    【飞腾派4G版免费试用】第二章:在PC端使用 TensorFlow2 训练目标检测模型

    ] ┗─╼[~/Projects/ai_track_feiteng/demo2/workspace] ▸ 接下来的操作都在这个虚拟环境中完成,下面开始安装 tensorflow2: pip
    发表于 12-15 06:44

    iTOP-RK3588开发板使用 tensorflow框架

    功能 - 它包含一个叫做张量概念,用来创建多维数组,优化和计算数学表达式。它包括深度神经网络和机器学习技术的编程支持。它包括具有各种数据集的高扩展计算功能。TensorFlow 使用 GPU 计算
    发表于 10-08 10:04

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    HHB 实现了在典型网络性能比第三方工具平均提升 88%,并增加支持运行 Transformer、TensorFlow、PyTorch 等 170 余个主流框架 AI 模型。 基于此,平头哥发布了首个
    发表于 08-26 14:14

    2023RISC-V中国峰会,澎峰科技成果发布抢先看!

    出席,预计将吸引超过百家企业及研究机构、开源技术社区,近百家媒体参与报道。 澎峰科技作为此次大会的参展商之一带来了重磅发布内容:RISC-V衡山系列服务器 成果介绍: RISC-V衡山系列服务器是针对
    发表于 08-15 18:28

    启英泰伦新成果发布交流会线上直播预约开启

    将为大家带来主题为《用AI解锁声音的奥秘——启英泰伦新成果发布交流会》的线上直播。 01 发布CI231系列AI语音BLE芯片 为了提供更
    发表于 08-15 14:31

    为什么无法使用POT优化TensorflowTF)或MXNet模型?

    无法使用 POT 优化 TensorflowTF) 或 MXNet 模型,以便在 英特尔凌动® 平台上使用 OpenVINO™ 工具套件进行推理。 运行 pot -h。 接收错误消息: 非法指令例外
    发表于 08-15 08:05

    TensorFlow将神经网络量化为8位

    TensorFlow模型,Arm建议您将32位未量化模型转换为CoreML。要将模型转换为CoreML,请使用34Tgithub.com/tf-CoreML/tf-coreml34T,然后
    发表于 08-10 06:01