0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google研究人提议对引擎重新设计并用单一大型AI语言模型代替

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-06-01 09:42 次阅读

1998 年,一些斯坦福大学的研究生发表了一篇论文,描述了一种新型的搜索引擎:“在本文中,我们将会介绍 Google 这种大型搜索引擎的原型。该原型大量使用了超文本形式的结构。Google 旨在有效地对万维网数据进行检索和编制索引,并生成比现有系统更令人满意的搜索结果。”

该研究的关键创新是一种称为 PageRank 的算法,该算法通过基于用户在网络上查询内容与网络上其他页面链接的相关性来计算搜索结果,并且对搜索结果进行排序。在 PageRank 的支持下,Google 成为了通往互联网的门户,而谢尔盖・布林和拉里・佩奇建立了世界上最大的公司之一。

现在,一组 Google 研究人员发布了一项提议,要求对引擎进行彻底的重新设计,从而排除现有排序的方法,并用单一的大型 AI 语言模型(例如 BERT 或 GPT-3,以及它们的未来版本)来代替。

这样一来,用户将不再用在庞大的网页列表中搜索信息,而是通过对这些页面上经过训练的语言模型提出问题来直接寻找答案。

这种方法不但可以改变搜索引擎的工作方式,而且可以改变它们可以做的事情,以及我们如何与之互动的方式。

即使网络的规模激增,搜索引擎也在变得越来越快,且越来越准确。现在我们使用 AI 来对结果进行排序,而 Google 可以通过 BERT 来更好地理解用户搜索的内容。

然而,在这些调整之下,所有主流搜索引擎的工作方式仍与 20 年前相同:爬虫将网页编入索引(可不间断地读取网络并维护找到的所有内容的列表的软件),在与用户查询相匹配的结果索引中收集数据,然后对结果进行排序。

唐纳德・麦茨勒(Donald Metzler)和他在 Google 研究部的同事写道:“这种索引检索然后排序的蓝图经受得住时间的考验,但也很少受到挑战或被认真地重新考虑一下。”

问题就在于,即使是当今最好的搜索引擎,它仍然会以包含所需信息的文档列表来进行响应,而不是包含信息本身。

搜索引擎也并不擅长回答需要从多个来源获得答案的查询任务,就像你看病时,医生给你一篇需要阅读的文章列表,而不是直接给你答案一样。

麦茨勒和他的同事对能像真人专家那样工作的搜索引擎十分感兴趣,它应当以自然语言生成答案,并由多个文档合成,而且像维基百科的文章一样,以支持证据的形式备份其答案。

大型语言模型为这样的想法奠定了一些基础,GPT-3 在大多数网络和数百本书上都接受过培训,它可以从多种来源中获取信息,以自然语言回答问题。

现在的问题在于它无法跟踪这些来源,也无法提供证据来支持这些答案。我们无法判断 GPT-3 是在模仿可信赖的信息还是虚假信息,或者只是散播自己的废话。

麦茨勒和他的同事们称语言模型为 Dilettantes——“人们以为它懂的很多,但实际上它的知识很肤浅。”

他们声称,解决方案是构建和培训未来的 BERT 和 GPT-3,以保留其单词来源的记录。目前尚无此类模型能够做到这一点,但原则上是可行的,并且朝着这个方向的早期工作也已被提上日程。

来自英国谢菲尔德大学研究网络信息检索的张子琦说,在不同的搜索领域,从响应用户查询、到总结文档、再到结构化信息,已经有了数十年的发展。

但是,这些技术都没有彻底改革过搜索,因为它们每个都只是解决特定的问题而无法被通用化。他说,这篇论文中提到的令人兴奋的事情就是一些大型语言模型能够同时完成所有这些操作。

然而,张也指出,语言模型在技术性或专业学科上表现不佳,因为训练这些语言的文本中很少有这类范例。

他说:“网络上关于电子商务的数据可能比有关量子力学的数据多数百倍。” 而且当今的语言模型也偏向英语,这会使网络上的非英语部分无法得到充分服务。

但张还是很喜欢这个主意,他说:“要是在过去,这么做是不可能的,因为大型语言模型只是最近才兴起的。如果成功了,它将改变我们的搜索体验。”

原文标题:GPT-3或宣告新型搜索引擎的诞生:通过语言模型提问即可找到答案

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26438

    浏览量

    264036
  • 语言
    +关注

    关注

    1

    文章

    97

    浏览量

    24039
  • GPT
    GPT
    +关注

    关注

    0

    文章

    300

    浏览量

    14867

原文标题:GPT-3或宣告新型搜索引擎的诞生:通过语言模型提问即可找到答案

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    生成式 AI 进入模型驱动时代

    随着ChatGPT和大型语言模型(LLM)呈现爆炸式增长,生成式人工智能(GenerativeAI)成为近来的一大热词。由此引发了一场争论:哪种AI
    的头像 发表于 04-13 08:12 198次阅读
    生成式 <b class='flag-5'>AI</b> 进入<b class='flag-5'>模型</b>驱动时代

    HarmonyOS:使用MindSpore Lite引擎进行模型推理

    场景介绍 MindSpore Lite 是AI 引擎,它提供了面向不同硬件设备 AI 模型推理的功能,目前已经在图像分类、目标识别、人
    发表于 12-14 11:41

    探索高效的大型语言模型大型语言模型的高效学习方法

    大型语言模型(LLMs)的应用中,提示工程(Prompt Engineering)是一种关键技术,用于引导模型生成特定输出或执行特定任务。通过精心设计的提示,可以显著提高LLMs的性
    发表于 12-13 14:21 320次阅读
    探索高效的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>!<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>的高效学习方法

    语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言
    的头像 发表于 12-04 15:51 403次阅读

    大型语言模型在关键任务和实际应用中的挑战

    大型语言模型的出现极大地推动了自然语言处理领域的进步,但同时也存在一些局限性,比如模型可能会产生看似合理但实际上是错误或虚假的内容,这一现象
    的头像 发表于 08-15 09:33 1139次阅读
    <b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>在关键任务和实际应用中的挑战

    清华大学大语言模型综合性能评估报告发布!哪个模型更优秀?

    近日,清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,该报告对目前市场上的7个大型语言模型进行了全面的综合评估。近年,大
    的头像 发表于 08-10 08:32 675次阅读
    清华大学大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>综合性能评估报告发布!哪个<b class='flag-5'>模型</b>更优秀?

    ChatGPT等大型语言模型的出现会带来哪些风险

    近日,美智库兰德公司高级工程师克里斯托弗·莫顿(Christopher Mouton)在C4ISRNET网站撰文,分析ChatGPT等大型语言模型的出现给国家安全带来的新风险。主要观点如下:
    发表于 08-04 11:44 326次阅读

    AI和大语言模型给云计算和DevOps带来了哪些影响?

    通过降低认知负载和为即时管理、工单系统和代码生成等任务提供支持,人工智能(AI)和大型语言模型(LLMs)可能在云计算和 DevOps 领域发挥重要作用。主要的云计算供应商,如微软、谷
    的头像 发表于 08-03 15:26 864次阅读
    <b class='flag-5'>AI</b>和大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>给云计算和DevOps带来了哪些影响?

    2023年发布的25个开源大型语言模型总结

    大型语言模型(llm)是一种人工智能(AI),在大量文本和代码数据集上进行训练。它们可以用于各种任务,包括生成文本、翻译语言和编写不同类型的
    的头像 发表于 08-01 00:21 613次阅读
    2023年发布的25个开源<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>总结

    2023年发布的25个开源大型语言模型总结

    来源: DeepHub IMBA 大型语言模型(llm)是一种人工智能(AI),在大量文本和代码数据集上进行训练。它们可以用于各种任务,包括生成文本、翻译
    的头像 发表于 07-28 12:20 467次阅读
    2023年发布的25个开源<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>总结

    AI模型的的三个发展阶段

    AI模型可分为自然语言处理大模型,CV大模型、科学计算大模型等。
    发表于 07-06 12:31 1570次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>的的三个发展阶段

    大型语言模型的应用

       大型语言模型(LLM) 是一种深度学习算法,可以通过大规模数据集训练来学习识别、总结、翻译、预测和生成文本及其他内容。大语言模型(LL
    的头像 发表于 07-05 10:27 1620次阅读

    基于Transformer的大型语言模型(LLM)的内部机制

    本文旨在更好地理解基于 Transformer 的大型语言模型(LLM)的内部机制,以提高它们的可靠性和可解释性。 随着大型语言
    的头像 发表于 06-25 15:08 1037次阅读
    基于Transformer的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>(LLM)的内部机制

    浅析AI大型语言模型研究的发展历程

    大型语言模型研究的发展有三条技术路线:Bert 模式、GPT 模式、混合模式。其中国内大多采用混合模式, 多数主流大型
    发表于 06-09 12:34 3760次阅读
    浅析<b class='flag-5'>AI</b><b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b><b class='flag-5'>研究</b>的发展历程

    大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息

      大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息?这一问题在计算机科学和自然语言处理领域一直存在争议。然而,MIT的一项新研究
    的头像 发表于 05-25 11:34 483次阅读
    <b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>能否捕捉到它们所处理和生成的文本中的语义信息