0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI技术面对最为艰巨挑战之一:人类自然语言理解

454398 来源:Venture Beat 作者:Pieter Buteneers 2021-02-02 15:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

短短几年之内,深度学习算法得到了长足发展,不仅在棋类游戏中击败了全球最顶尖的选手,也能够以等同于、甚至超越人类的准确率识别人脸。但事实证明,人类语言仍是一项独特且深邃的难题,亦是AI技术所面对的最为艰巨的挑战之一。

但是,突破能否如期而至?

一旦计算机可以有效理解人类语言内容,则必将彻底颠覆全球各品牌、企业与组织之间的交互方式。如今,大多数企业拿不出充裕的资源为每位客户提供一对一解答服务。但在语言AI真正成熟之后,企业将能够在任意时间通过任意渠道听取、理解并回应每一个问题。这是一项激动人心的发展愿景,但距离达成目标仍有漫长的道路要走。

直到2015年,人们才构建出一种足以在准确率方面与他类相匹敌的人脸识别算法。Facebook的DeepFace准确率为97.4%,仅略低于人类的97.5%。作为参考,FBI以往的人脸识别算法准确率仅为85%,意味着其做出的判断有超过七分之一概率是错的。

FBI算法是由一组工程师手工开发而成。其中每项特征(例如鼻子大小以及眼睛的相对位置)皆由手动编程而来。Facebook算法则真正实现了特征学习,其利用一种被称为卷积神经网络的特殊深度学习架构,模拟出人类视觉皮层通过复杂的多层结构处理图像内容。事实上,我们并不清楚这些皮层之间是如何联系的,因此一切“奥秘”都由算法自主探索得来。

Facebook之所以能够达成这一成就,依靠的正是实现类人级人工智能的两个基本思路:首先建立一套能够学习特征的架构,再将数百万张经过标记的高质量图像作为训练素材供其学习。

语言难关就在眼前

视觉的诞生虽然困难,但已经有数百万种物种在进化过程中攻克了这道难关。相比之下,语言似乎更为复杂。据我们所知,人类是目前唯一能够使用复杂语言交流想法的物种。

不到十年之前,出现了单凭某些词汇的出现频率即可大致推理出语义的AI算法。但这种方法显然忽视了同义词元素的存在,也无法应对某些表达在不同上下文中具有不同表意的问题。

2013年,Tomas Mikolov和他的谷歌团队创造出一种能够学习单词含义的架构。他们的word2vec算法能够将同义词相互映射,借此对大小、性别、速度等语义进行建模,甚至能够将国家与首都等特征关联起来。

但其中仍然缺少至关重要的一环——理解上下文。语言理解领域的真正突破诞生于2018年,谷歌公司在这时推出了BERT模型。Jacob Devlin和他的团队仍然沿用传统机器翻译中的架构,但向其中引入了学习句子内上下文信息的能力。

通过教育该模型填补维基百科文章中的遗漏单词,该团队得以将语言结构嵌入BERT模型。只需要使用数量有限的高质量标记数据,他们就成功完成了对BERT的调优,借此完成从为问题找到正确答案、到真正理解句子表意的多种任务。也凭借这一壮举,他们成为破解语言理解谜题的先驱:正确架构,加上大量可供学习的高质量数据。

2019年,Facebook的研究人员在此基础上又更进了一步。他们同时使用100种语言训练出类似的BERT模型。此模型能够以一种语言(例如英语)进行特征学习,再将成果应用于其他任意一种语言(例如阿拉伯语、汉语及北印度语)。这种具有语言中立性的模型能够在实际训练所选定的语种上实现与BERT完全一致的性能,并在迁移至另一种语言时将影响控制在较低程度。

这些技术本身确实给人留下了深刻印象。但在2020年初,谷歌研究人员最终得以在广泛的语言理解任务上超越了人类的表现。谷歌引入规模更大的网络架构与更多训练数据,终于将BERT架构推向了极限。如今,这套被命名为T5的架构在标记句子与寻找答案方面的表现已经超越人类。去年10月发布的多语种mT5模型已经能够在双语种间互译方面实现与人类相近的表现,更恐怖的是它能够支持多达100种语言。谷歌本周又公布了新的万亿级参数模型,整体架构规模更上一层楼,性能也进一步提升。

可能性

设想一下,未来的聊天机器人也许能够理解您用任何一种语言书写的内容,真正理解上下文并记住之前聊过的内容。这意味着我们得到的不再只是几条简单粗暴的预定义回应,而是真正的关切与解答。

索引擎也将能够理解您的问题,给出正确答案,而且不再纠结于您的用词是否严格准确。您可能还会迎来一位AI同事,它了解关于业务流程的所有知识。更重要的,如果能够使用正确的术语,那么单靠谷歌搜索没准就能解决客户的具体问题。连篇累牍的内部文档终将成为过去,留给AI模型快速浏览即可。

数据库的新时代即将来临。我们将彻底告别构造数据的繁琐工作——一切备忘录、电子邮件、报告都将由AI模型自动解释、存储与索引。由于数据库能够理解人类表达,您不需要求助于IT部门即可直接查询并创建报告。

这一切还只是冰山一角。目前一切依赖于人类语言理解能力的流程,都有可能被自动化功能所彻底颠覆。

没那么简单

但这里还有个问题。既然这么出色了,为什么这些算法还没得到普遍应用?因为单靠云计算资源训练T5算法,就花掉了谷歌约130万美元。幸运的是,谷歌研究人员慷慨地分享了这些模型。但如果要对当前任务进行调优,还需要额外承担一大笔资源开销,外加漫长的训练周期。

不过随着时间的推移,企业对于调优工作的不断探索,相信未来会有更多应用方案陆续涌现。另外,如果大家相信摩尔定律,那么五年左右之后我们就会迎来更复杂的语言AI应用,届时也会有新的模型全面超越T5算法。

2021年,我们距离AI技术的转折性突破还有遥远的距离。但只要能够迈过这道难关,AI技术必将释放出无穷的可能性。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50537

    浏览量

    267852
  • 人脸识别
    +关注

    关注

    77

    文章

    4137

    浏览量

    88940
  • 深度学习
    +关注

    关注

    73

    文章

    5614

    浏览量

    124765
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [完结15章]Java转 AI高薪领域必备-从0到1打通生产级AI Agent开发

    数据的检索增强生成(RAG)系统。这也是Java+AI转型的技术深水区。 RAG绝非简单的向量检索,它是项复杂的系统工程。Java工程师需要跨界理解
    发表于 04-30 13:46

    Vibe Coding AI全栈开发实战

    门槛 Vibe Coding的核心在于自然语言驱动开发。开发者无需掌握复杂的编程语法和框架细节,只需用日常语言描述需求,AI就能理解并生成相应的代码。这种交互方式极大地降低了
    发表于 04-15 16:02

    汇顶科技推出全球首个为AI Agents设计的安全芯片解决方案

    随着AI Agents 从云端走向终端,越来越多的硬件产品如智能音箱、车载助手、企业终端、家庭网关等,开始集成AI的能力,让设备能够理解自然语言、调用云端大模型、自主执行复杂任务。
    的头像 发表于 04-10 14:55 414次阅读
    汇顶科技推出全球首个为<b class='flag-5'>AI</b> Agents设计的安全芯片解决方案

    安霸AI SoC放大招:深度适配OpenClaw,驱动机器人自主进化

    AI 大模型落地需要端侧算力的支持,时间的节点已经到来。现在的人形机器人需要自主决策的能力,可以用自然语言人类交互,并且理解人类布置的任务,自主做决策。”安霸半导体研发总监钱豪表示
    的头像 发表于 03-17 16:07 8504次阅读
    安霸<b class='flag-5'>AI</b> SoC放大招:深度适配OpenClaw,驱动机器人自主进化

    论马斯克的预言:AI使人类边缘化

    当地时间3月11日,在“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,在超高量级AI面前,人类终将走向边缘化。以下是对这
    发表于 03-14 05:27

    自然语言处理NLP的概念和工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的个分支,它会教计算机如何理解口头和书面形式的人类语言
    的头像 发表于 01-29 14:01 702次阅读
    <b class='flag-5'>自然语言</b>处理NLP的概念和工作原理

    为什么说连锁行业比电商更需要AI

    的试炼场。 电商全链路智能化:从“被动响应”到“主动理解” 在消费者端,AI技术的深度介入正在重塑购物体验。淘宝推出的“AI万能搜”能够理解
    的头像 发表于 11-18 18:24 248次阅读
    为什么说连锁行业比电商更需要<b class='flag-5'>AI</b>?

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知声提交的《面向门诊病历生成的高质量医患对话合成技术
    的头像 发表于 11-10 17:30 974次阅读
    云知声论文入选<b class='flag-5'>自然语言</b>处理顶会EMNLP 2025

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    解决人类智能无法解决的复杂问题。实现AGI的AI相关研究机构和企业的主要目标。 、生成式AI点燃AGI之火 CHatGPT就是已经取得成功的生成式
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    具身智能芯片:说白了就是能够感知、思考推理以及决策的体式可达人类智能水平的智能体-----就跟电影里的样。 、具身智能 第人称视角:
    发表于 09-18 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱
    发表于 09-17 11:45

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    GPIO 等),并返回结果。 Cangjie Magic 角色 :构建MCP服务器,同时提供自然语言理解能力,将用户输入的文本(如 “查看开发板 IP 地址”“点亮 LED1”)转换为机器可识别的指令(如
    发表于 08-23 13:10

    HarmonyOS AI辅助编程工具(CodeGenie)代码续写

    利用AI大模型分析并理解开发者在代码编辑区的上下文信息或自然语言描述信息,智能生成符合上下文的ArkTS或C++代码片段。 、使用约束 建议在编辑区内已有较丰富上下文,能够使模型对编
    发表于 07-15 16:15

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    多个学科知识。例如,在计算机视觉领域,了解物理学中的光学知识有助于理解图像的形成和采集过程;在自然语言处理中,语言学知识可以帮助更好地处理文本语义。 二、实践与项目经验方面 参与开源项目 在
    发表于 07-08 17:44

    冰箱智能化升级方案:WT3000A离在线AI语音模组赋能AI在线对话功能

    随着人工智能(AI)和物联网(IoT)技术的快速发展,智能家居市场持续增长,消费者对家电的交互体验提出了更高要求。冰箱作为家庭核心家电之一,其智能化升级成为行业趋势。传统冰箱主要依赖物理按键或触摸屏操作,而
    的头像 发表于 06-07 14:45 892次阅读