0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google研究人提议对引擎重新设计并用单一大型AI语言模型代替

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-06-01 09:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1998 年,一些斯坦福大学的研究生发表了一篇论文,描述了一种新型的搜索引擎:“在本文中,我们将会介绍 Google 这种大型搜索引擎的原型。该原型大量使用了超文本形式的结构。Google 旨在有效地对万维网数据进行检索和编制索引,并生成比现有系统更令人满意的搜索结果。”

该研究的关键创新是一种称为 PageRank 的算法,该算法通过基于用户在网络上查询内容与网络上其他页面链接的相关性来计算搜索结果,并且对搜索结果进行排序。在 PageRank 的支持下,Google 成为了通往互联网的门户,而谢尔盖・布林和拉里・佩奇建立了世界上最大的公司之一。

现在,一组 Google 研究人员发布了一项提议,要求对引擎进行彻底的重新设计,从而排除现有排序的方法,并用单一的大型 AI 语言模型(例如 BERT 或 GPT-3,以及它们的未来版本)来代替。

这样一来,用户将不再用在庞大的网页列表中搜索信息,而是通过对这些页面上经过训练的语言模型提出问题来直接寻找答案。

这种方法不但可以改变搜索引擎的工作方式,而且可以改变它们可以做的事情,以及我们如何与之互动的方式。

即使网络的规模激增,搜索引擎也在变得越来越快,且越来越准确。现在我们使用 AI 来对结果进行排序,而 Google 可以通过 BERT 来更好地理解用户搜索的内容。

然而,在这些调整之下,所有主流搜索引擎的工作方式仍与 20 年前相同:爬虫将网页编入索引(可不间断地读取网络并维护找到的所有内容的列表的软件),在与用户查询相匹配的结果索引中收集数据,然后对结果进行排序。

唐纳德・麦茨勒(Donald Metzler)和他在 Google 研究部的同事写道:“这种索引检索然后排序的蓝图经受得住时间的考验,但也很少受到挑战或被认真地重新考虑一下。”

问题就在于,即使是当今最好的搜索引擎,它仍然会以包含所需信息的文档列表来进行响应,而不是包含信息本身。

搜索引擎也并不擅长回答需要从多个来源获得答案的查询任务,就像你看病时,医生给你一篇需要阅读的文章列表,而不是直接给你答案一样。

麦茨勒和他的同事对能像真人专家那样工作的搜索引擎十分感兴趣,它应当以自然语言生成答案,并由多个文档合成,而且像维基百科的文章一样,以支持证据的形式备份其答案。

大型语言模型为这样的想法奠定了一些基础,GPT-3 在大多数网络和数百本书上都接受过培训,它可以从多种来源中获取信息,以自然语言回答问题。

现在的问题在于它无法跟踪这些来源,也无法提供证据来支持这些答案。我们无法判断 GPT-3 是在模仿可信赖的信息还是虚假信息,或者只是散播自己的废话。

麦茨勒和他的同事们称语言模型为 Dilettantes——“人们以为它懂的很多,但实际上它的知识很肤浅。”

他们声称,解决方案是构建和培训未来的 BERT 和 GPT-3,以保留其单词来源的记录。目前尚无此类模型能够做到这一点,但原则上是可行的,并且朝着这个方向的早期工作也已被提上日程。

来自英国谢菲尔德大学研究网络信息检索的张子琦说,在不同的搜索领域,从响应用户查询、到总结文档、再到结构化信息,已经有了数十年的发展。

但是,这些技术都没有彻底改革过搜索,因为它们每个都只是解决特定的问题而无法被通用化。他说,这篇论文中提到的令人兴奋的事情就是一些大型语言模型能够同时完成所有这些操作。

然而,张也指出,语言模型在技术性或专业学科上表现不佳,因为训练这些语言的文本中很少有这类范例。

他说:“网络上关于电子商务的数据可能比有关量子力学的数据多数百倍。” 而且当今的语言模型也偏向英语,这会使网络上的非英语部分无法得到充分服务。

但张还是很喜欢这个主意,他说:“要是在过去,这么做是不可能的,因为大型语言模型只是最近才兴起的。如果成功了,它将改变我们的搜索体验。”

原文标题:GPT-3或宣告新型搜索引擎的诞生:通过语言模型提问即可找到答案

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296680
  • 语言
    +关注

    关注

    1

    文章

    97

    浏览量

    24757
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16715

原文标题:GPT-3或宣告新型搜索引擎的诞生:通过语言模型提问即可找到答案

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱
    发表于 09-17 11:45

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新AI
    发表于 07-16 15:29

    RAKsmart高性能服务器集群:驱动AI语言模型开发的算力引擎

    RAKsmart高性能服务器集群凭借其创新的硬件架构与全栈优化能力,成为支撑大语言模型开发的核心算力引擎。下面,AI部落小编带您了解RAKsmart如何为
    的头像 发表于 04-15 09:40 523次阅读

    Google发布最新AI模型Gemma 3

    Gemma 开放模型系列是 Google 推动实用 AI 技术普惠大众的重要基石。上个月,Gemma 迎来了首个生日。回望过去年,其成果斐然:全球下载量突破 1 亿,社区欣欣向荣,衍
    的头像 发表于 03-18 09:51 1471次阅读

    无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?

    无法在 OVMS 上运行来自 Meta 的大型语言模型 (LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时遇到错误。
    发表于 03-05 08:07

    广和通AI玩具解决方案通过火山引擎成功接入DeepSeek开源模型

    2月17日,广和通AI玩具解决方案通过火山引擎接入DeepSeek开源模型,满足AI玩具场景在多模态交互、自然语言处理、情感分析、教育功能等
    的头像 发表于 03-03 17:45 1072次阅读
    广和通<b class='flag-5'>AI</b>玩具解决方案通过火山<b class='flag-5'>引擎</b>成功接入DeepSeek开源<b class='flag-5'>模型</b>

    小白学大模型:训练大语言模型的深度指南

    在当今人工智能飞速发展的时代,大型语言模型(LLMs)正以其强大的语言理解和生成能力,改变着我们的生活和工作方式。在最近的
    的头像 发表于 03-03 11:51 1211次阅读
    小白学大<b class='flag-5'>模型</b>:训练大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的深度指南

    语言模型的解码策略与关键优化总结

    本文系统性地阐述了大型语言模型(LargeLanguageModels,LLMs)中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工
    的头像 发表于 02-18 12:00 1074次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的解码策略与关键优化总结

    文详解视觉语言模型

    视觉语言模型(VLM)是种多模态、生成式 AI 模型,能够理解和处理视频、图像和文本。
    的头像 发表于 02-12 11:13 3260次阅读
    <b class='flag-5'>一</b>文详解视觉<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    机器人大语言模型市场2028年将破千亿美元

    近日,根据TrendForce集邦咨询的最新研究成果,随着机器技术的不断进步和系统的高度整合,它们有望从传统的工业场景逐渐走进人们的家庭生活。这
    的头像 发表于 01-22 11:02 765次阅读

    什么是AI查询引擎

    AI 查询引擎可高效处理、存储和检索大量数据,以增强生成式 AI 模型的输入。
    的头像 发表于 01-10 10:00 2381次阅读

    Google两款先进生成式AI模型登陆Vertex AI平台

    新的 AI 模型,包括最先进的视频生成模型Veo以及最高品质的图像生成模型Imagen 3。近日,我们在 Google Cloud 上进
    的头像 发表于 12-30 09:56 982次阅读

    AI语言模型开发步骤

    开发个高效、准确的大语言模型个复杂且多阶段的过程,涉及数据收集与预处理、模型架构设计、训练与优化、评估与调试等多个环节。接下来,
    的头像 发表于 12-19 11:29 1221次阅读

    谷歌发布“深度研究AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言
    的头像 发表于 12-16 09:35 1039次阅读

    NaVILA:加州大学与英伟达联合发布新型视觉语言模型

    日前,加州大学的研究人员携手英伟达,共同推出了款创新的视觉语言模型——NaVILA。该模型在机器
    的头像 发表于 12-13 10:51 959次阅读