0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌的人工智能实现了最先进的文本摘要性能

倩倩 来源:网易智能 2020-01-05 09:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

自动文本摘要是机器学习算法正在努力的方向之一,微软近期发布的相关论文也表明了这一趋势。对于那些每天要阅读大量文字信息的工作者们来说,这是一个值得庆贺的好消息。有调查显示,这类工作者每天仅在阅读信息上就要花费大约2.6小时。

相应的,Google Brain和伦敦帝国理工学院的一个团队构建了一个系统——Pegasus(Pre-training with Extracted Gap-sentences for Abstractive Summarization Sequence-to-sequence),它使用了谷歌的变形金刚架构,结合了针对文本摘要能力的预训练目标。据称,它在12种测试中均达到了达到最先进的水平,这些测试包括了科学、故事、电子邮件、专利和立法法案等。不仅如此,它在材料缺乏的文本整合测试中也表现惊人。

正如研究人员指出的那样,文本摘要的目的是总结输入的文档,生成其准确和简洁的摘要。

抽象的摘要也不是简单地从输入的文本中复制粘贴文字的片段,而是会产生新单词或总结重要信息,从而使输出的语言保持流畅。

变形金刚是Google Brain (谷歌的人工智能研究部门)的研究人员在介绍的一种神经结构。

它提取特征以及学习做出预测的方式和所有的深度神经网络一样:神经元被安排在相互连接的层中,这些层传递着输入数据的信号,调整每个连接的权重。

但变形金刚架构又有其独特之处:每个输出元素和每个输入元素都有连接,并动态计算它们之间的权重。

在测试中,研究小组选择了表现最佳的Pegasus模型,该模型包含了5.68亿个参数。它有两个训练材料。一个是从3.5亿个网页中提取出来的文本,有750GB。还有一个训练材料则覆盖了15亿篇新闻类型的文章,总计3.8TB。研究人员说,在后者的情况下,他们用白名单域来植入网络爬虫工具,覆盖了质量参差不齐的内容。

根据研究员的说法,Pegasus生成的摘要语言非常优秀,流畅性和连贯性都达到了高水准。此外,在文本匮乏的环境中,即使只有100篇示例文章,它生成的摘要质量与在20,000到200,000篇文章的完整数据集上训练过的模型相当。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6245

    浏览量

    110270
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97156
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【产品介绍】Altair RapidMiner数据分析与人工智能平台

    AltairRapidMiner赋能组织解锁数据洞察,运用数据分析和先进的人工智能自动化,提供可扩展的面向未来的解决方案。Altair数据分析和人工智能平台包括数据准备、数据科学、MLOps、编排
    的头像 发表于 09-18 17:56 650次阅读
    【产品介绍】Altair RapidMiner数据分析与<b class='flag-5'>人工智能</b>平台

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    挖到宝人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:30

    挖到宝!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:23

    关于人工智能处理器的11个误解

    应用,以及哪些是真实情况而哪些只是炒作,仍存在诸多误解。GPU是最佳的人工智能处理器尽管GPU在人工智能实现过程中发挥了关键作用,而且如今它们的应用也极为广泛,但将其推
    的头像 发表于 08-07 13:21 881次阅读
    关于<b class='flag-5'>人工智能</b>处理器的11个误解

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    生成式人工智能认证:重构AI时代的人才培养与职业跃迁路径

    ,恰似一座连接技术前沿与个体成长的桥梁,既承载着时代对人才的迫切需求,也指向着未来职场的核心竞争力。 一、技术革命的双重性:赋能与失衡并存 生成式人工智能的突破性,在于其首次让机器具备“无中生有”的创造力。从文本生成到图像
    的头像 发表于 05-23 09:29 613次阅读

    科大讯飞加速东南亚企业的人工智能应用

    日前,科大讯飞在新加坡成功举办合作伙伴峰会暨创新产品发布会。这场汇聚关键合作伙伴、行业先驱和技术领袖的盛会,不仅集中展示科大讯飞最新AI创新成果,更彰显人工智能推动企业业务转型的决心。 活动
    的头像 发表于 05-06 09:39 698次阅读

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    苹果软件更新默认启用人工智能

    macOS Sequoia 15.3,旨在为支持苹果人工智能的设备默认启用Apple Intelligence功能。这一变化意味着,用户在更新后无需手动设置,即可直接使用苹果提供的人工智能服务。 然而,值得注意的是,苹果在此次更新中也禁用了新闻应用中的AI
    的头像 发表于 02-05 14:04 650次阅读

    谷歌再投10亿美元于人工智能公司Anthropic

    近日,Alphabet Inc.旗下的谷歌再度出手,向人工智能开发商Anthropic追加了10亿美元的投资,进一步提升了其在这家潜力无限、有望与OpenAI展开竞争的公司中的持股比例。 据一位
    的头像 发表于 01-23 10:57 848次阅读

    Embarcadero:人工智能驱动发展我们的期望是什么

    发展的方向。 这是一张在simplified.com上,通过提示“屏幕上有人工智能的笔记本电脑”而生成的人工智能图像。这一实现令人印象深刻,但同样任重道远。图像和电影比文本更难处理。难
    的头像 发表于 01-15 10:46 646次阅读

    人工智能推理及神经处理的未来

    人工智能行业所围绕的是一个受技术进步、社会需求和监管政策影响的动态环境。机器学习、自然语言处理和计算机视觉方面的技术进步,加速人工智能的发展和应用。包括医疗保健、金融和制造业在内的各个行业对自动化
    的头像 发表于 12-23 11:18 871次阅读
    <b class='flag-5'>人工智能</b>推理及神经处理的未来

    Infosys与谷歌云加强合作,推动企业人工智能创新,建立卓越中心

    利用Infosys Topaz和谷歌云技术,卓越中心将促进共同创新,提供变革性的人工智能解决方案  印度班加罗尔2024年12月19日 /美通社/ -- 下一代数字服务和咨询领域的全球领军者
    的头像 发表于 12-19 15:33 603次阅读

    Reddit测试人工智能问答功能Reddit Answers

    Answers旨在帮助用户根据帖子内容快速找到所需答案。用户可以通过类似ChatGPT、Perplexity等生成式人工智能服务的方式,向Reddit Answers提出问题。该功能将利用先进的人工智能
    的头像 发表于 12-12 09:46 967次阅读