0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Richard Socher:NLP领域的发展要过三座大山

mK5P_AItists 来源:未知 作者:胡薇 2018-09-06 11:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“我的飞机什么时候到?”把这个问题抛给智能机器人助手。几乎可以肯定,机器立马就懵逼了。“我”是谁?“飞机”是航班还是淘宝上订的模型玩具呢?“到”又是到哪呢?如果是人类来回答这个问题,即使在情景不明确的情况下也能在快速澄清后给出回答,但对机器来说,除非依赖大量人为制定的规则,回答这样的问题难度堪比“哥德巴赫猜想”。

面对自然语言处理发展(NLP)存在的诸多难题,该领域的大牛、Salesforce的首席科学家Richard Socher在近日指出:NLP领域的发展要过三座大山。

困扰NLP领域的这三座大山究竟是什么?一起来听大佬说。

一直以来,语言都被认为是人类的独特能力,是智慧的表现。但最近,自然语言处理技术的发展似乎也将语言能力赋予给了机器。

帮你打电话订餐,给你讲故事,解决各种刁钻的冷知识问答…机器的语言能力已经无限接近人类水平。

现在你可以走进昏暗的客厅,让Alexa把智能灯的亮度提高到75%。你也可以询问他世界另一边的天气情况。在Google最近的Duplexde,AI助理已经能够给理发店打电话,为你预约剪发。

曾经被视为科幻的场景现在变为了现实,但为了维持真正的人机关系,机器必须能够与人进行更直观、理解上下文和自然的对话--这仍然是一个挑战。我致力于研究NLP,但是就像AI一样,我们还在这个旅程的开始阶段。

语言是分享信息和与周围连接的一种机制,但是机器需要理解语言的复杂性以及作为人类是如何使用语言进行交流的。情感分析、问题回答和联合多任务学习方面的进步使AI能够真正理解人类以及我们的交流方式。

情感分析

语言本身就是复杂的。它不断发展,而且细致入微,一般人需要数年才能掌握。通过情绪分析,我们可以使用AI来理解特定内容,比如品牌或电影评价是正面的、负面的还是中性的。

我们也能弄清楚演讲者的态度和意图(她是生气,高兴,惊讶还是准备好要买东西了?)。从客户服务到在线社区调节再到算法交易,能够即时分析数千条推特和数百条产品评论来理解公众对一个品牌的看法,这对于企业来说是非常有价值的。

情感分析技术已经存在了一段时间,但并不总是非常精准。随着NLP的进展,这种情况正在发生变化。在我担任首席科学家的Salesforce,我们的AI(叫做Einstein)允许品牌能够通过电子邮件,社交媒体,和聊天短信得到实时的情感分析,为客户提供更好的体验。

准确的情感分析,例如,服务代理可帮助了解应优先服务哪些不满意的客户,或者应向谁提供优惠。也可识别产品缺陷,衡量产品满意度,通过社交平台改变人们对品牌的认知。其他科技公司也提供类似服务。

对于情感分析来说,理解上下文也是很重要的。假设你有一家肥皂公司,有人在推特上说:“这种肥皂对婴儿来说真的很棒。”这可以是对儿童肥皂的积极支持,也可能是暗讽这对孩子来说很可怕。

这句陈述可能包含很多上下文,但又很简单!使用AI分析某一句子结构的所有可能性,并理解一个人在特定语境下的用意,是NLP研究的重大挑战。它既需要标记数据来改进模型培训,也需要新的模型在学习上下文的同时在许多不同类型的任务之间共享知识。

问 答

随着NLP更好地解析文本的含义,帮助管理我们生活的数字助理智能将会提高。Siri和Google Assistant等应用程序可为常见问题提供优质答案,并执行简单的命令。理想情况下,我们应该能够问电脑任意问题,并且得到好的答案。

提供更好答案的一种方式是确保计算机理解问题。如果你问“我的飞机什么时候到达?”计算机怎么知道是在谈论你的航班还是从亚马逊订购的木工工具呢?

通过对语义的更深入理解,再加上对上下文数据的更好使用,计算机在判断语义这方面正变得越来越好。我们正在研究如何使用NLP学习每一层上下文,这样AI就可以同时处理所有内容,而不会错过重要的信息。

例如,动态共聚焦网络(dynamic coattentionnetworks可以根据不同的问题对单个文档进行不同的解释,比如,面对一篇体育报道,在回答“哪位运动员获得了冠军?”和“最年轻的参赛者是几岁?”这两个问题是,机器就能对这篇报道作出不同的理解,从而反复假设多个答案,最终得到最好、最准确的结果。

联合多任务学习

科学界善于构建能很好地执行单个任务的人工智能模型。但是,更直观、会话式的并联系上下文的界面则需要一个不断学习的AI模型,它能够将新任务与旧任务集成起来,并在这个过程中学习执行更加复杂的任务。总体上来说,这对所有AI都是适用的,但在语言方面尤其如此,因为语言需要灵活性。

“谁是我的客户?”这是一个十分简单的任务:创建客户列表。但是,“谁是太平洋西北地区对某一特定产品的最佳潜在客户呢”?这样的问题增加了一层复杂性,需要大量的集成任务来提供答案,例如:如何定义“最佳”?客户定位在哪里?是什么因素导致客户对产品感兴趣的?每增加一个因素,问题的复杂性都会急剧增加。

Salesforce研究公司最近进行了一项名为“自然语言十项全能”的研究,该研究将多个任务转化为问答的形式,从而在一个单模型中解决了NLP最困[1]难的10项任务:问题回答,机器翻译,摘要,自然语言推理,情感分析,语义角色标注,关系提取,目标导向对话,数据库查询生成,代词消解。

使用多任务问答模型,将每个任务作为一种问答形式,单个模型在没有任何特定参数或模块的情况下共同学习和处理不同的任务。这不仅意味着数据科学家不再需要为每项任务建立、训练和优化单个模型,而且还意味着该模型具有零射击(zero-shot)学习能力---换句话说就是该模型可以处理以前从未见过或专门训练过的任务。

随着研究人员继续改进这样的模型,我们会看到AI界面在承担更复杂任务时变得更聪明。

虽然我们已经研究NLP很长时间了,但我们要走的路还长着呢。希望随着NLP技术的提升,人类与机器的交互形式最终能够迎来质的飞跃。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自然语言
    +关注

    关注

    1

    文章

    292

    浏览量

    13921
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23192

原文标题:语言处理想突破,三座大山必须过

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    台积电再扩2纳米产能:AI狂潮下的产能豪赌

    新台币(约合286亿美元),将使台积电在台湾的2纳米制程产能规划总量达到10,进一步巩固其在全球半导体制造领域的领先地位。 AI需求引爆产能缺口,9000亿新台币加码背后的订单逻辑 台积电此次新增三座2纳米工厂的计划,并非突发
    的头像 发表于 11-26 08:33 7438次阅读

    智能ODF配线架如何破解光纤管理难题?

    在某大型数据中心,运维人员曾面临这样的困境:数千芯光纤错综复杂,一次跳纤操作需3人协作2小时,且故障排查依赖经验。而如今,智能ODF配线架的出现,让这一切成为历史。 一、传统光纤管理的“三座大山
    的头像 发表于 10-30 11:33 180次阅读

    油气化工行业低压电器设备有何创新发展路径

    能效、成本、可靠性,作为国民经济的重要支柱,流程工业的高质量发展绕不过这“三座大山”。其中,油气化工、冶金等重点行业对电气设备的依赖程度高,设备性能直接关系到生产连续性、运营成本与环境影响。由此,翻越“大山”的路径不由得共同指向
    的头像 发表于 10-16 16:03 340次阅读

    小封装,大智慧:WTV380C流媒体功放芯片集成独立解码能力,最高32M内置Flash存储和D类功放!

    一起来看看。传统音频播放方案的“三座大山”说起传统的音频播放方案,相信很多工程师朋友都有一肚子苦水倒。就像搬家时那些又重又占地方的老家具,传统方案也面临着个让人头疼的问题:体积大得像个"小胖墩"、音质
    的头像 发表于 10-13 17:25 501次阅读
    小封装,大智慧:WTV380C流媒体功放芯片集成独立解码能力,最高32M内置Flash存储和D类功放!

    实战分享:如何通过IoT数据中台与预测性维护,将工厂OEE提升25%?

    就像“黑箱”,效率高低全凭老师傅经验;设备说坏就坏,一停就是一整天,损失的都是真金白银…… 成本失控、效率低下、质量波动——这制造业的“三座大山”,压得人喘不过气。 很多人首先想到的是“机器换人”,但动辄千万的
    的头像 发表于 08-25 15:25 358次阅读
    实战分享:如何通过IoT数据中台与预测性维护,将工厂OEE提升25%?

    谷东智能亮相2025年AI眼镜产业共创共赢峰会

    近日,在潮电智库主办的“2025年第二届AI眼镜产业共创共赢峰会”上,谷东智能用一场不到20分钟的主题演讲,把过去困扰AI+AR眼镜的“三座大山”——高功耗、高成本、高退货率——一口气掀翻。演讲结束
    的头像 发表于 07-26 14:19 1528次阅读

    看点:台积电在美建两先进封装厂 博通十亿美元半导体工厂谈判破裂

    先进的封装工厂将分别用于导入 3D 垂直集成的SoIC工艺和 CoPoS 面板级大规模 2.5D 集成技术。 据悉台积电的这两先进封装厂的选址位于亚利桑那州,紧邻具备 N2 / A16 节点产能的第三座晶圆厂。 博通十亿美
    的头像 发表于 07-15 11:38 1558次阅读

    千方科技推出AI大模型公路构造物评定系统

    公路构造物(桥梁、隧道、涵洞等)检测评定是养护管理的核心环节,通过量化构造物的技术状况评定等级,可为养护资源分配决策提供技术支持。传统公路构造物技术状况评定面临“三座大山”:一是评定结果易受人
    的头像 发表于 07-09 15:54 726次阅读

    SiC/磁材破局关键战!百余位技术精英聚首东莞

    在“双碳”目标的驱动下,光储充产业迎来爆发式增长,但效率瓶颈、安全焦虑与成本高压仍是横亘在行业面前的三座大山。 6月26日,第十六届光储充关键元器件技术创新研讨会邀请来自德州仪器(TI)、瑞萨电子
    的头像 发表于 06-23 16:28 529次阅读
    SiC/磁材破局关键战!百余位技术精英聚首东莞

    聚徽视角|粉尘、油污、震动:工业触摸屏一体机如何攻克重工业环境“三座大山”?

    在钢铁冶炼、矿山开采、船舶制造等重工业场景中,工业触摸屏一体机需直面粉尘、油污、震动的重考验。某钢铁厂高炉控制屏因粉尘侵入导致触控失灵,引发高炉停产事故,单日损失超500万元;某船舶发动机调试台因
    的头像 发表于 06-11 14:21 585次阅读

    RAKsmart服务器如何助力企业破解AI转型的难题

    当今,企业AI转型已成为提升竞争力的核心战略。然而,算力不足、成本失控、部署复杂等问题却成为横亘在转型路上的“三座大山”。面对这一挑战,RAKsmart服务器凭借其技术创新与全球化资源整合能力,为企业提供了一套从底层硬件到上层应用的全栈解决方案,助力企业突破AI转型瓶颈。
    的头像 发表于 05-27 10:00 329次阅读

    “奥斯卡”认证!aigo凭借创新与科技美学拿下三座缪斯设计奖金奖

    全球设计领域再传捷报!aigo国民好物旗下产品:以P5磁吸移动固态硬盘为代表的款产品,凭借突破性的功能设计,卓越的用户体验,荣获国际权威设计奖项美国缪斯设计奖(MUSEDesignAwards
    的头像 发表于 04-21 12:40 617次阅读
    “奥斯卡”认证!aigo凭借创新与科技美学拿下<b class='flag-5'>三座</b>缪斯设计奖金奖

    揭秘:安科瑞实现地铁等公共交通车站内灯箱智能照明控制的重要性

    痛点直击:地铁灯箱照明的“三座大山” 1. 能耗黑洞:传统灯箱24小时全亮,电费成本居高不下。 2. 维护难题:人工巡检效率低,突发故障难追溯。 3. 体验割裂:固定亮度模式无法匹配客流峰谷,乘客
    的头像 发表于 02-27 14:22 661次阅读
    揭秘:安科瑞实现地铁等公共交通车站内灯箱智能照明控制的重要性

    台积电亚利桑那州第三座工厂或于6月动工

    近日,市场传言台积电可能加速推进美国亚利桑那州第三座工厂的建设计划,并计划在6月份举行动工典礼。这一消息引起了业界的广泛关注。 针对此传言,台积电方面进行了回应。他们表示,对于市场传闻,公司通常不予
    的头像 发表于 02-18 10:49 695次阅读

    宁德时代计划在欧洲建立第四电池工厂,深化合资合作战略

    在近日达沃斯论坛的活动中,宁德时代联席董事长潘健透露了一个重要消息:公司有望在今年确定其在欧洲的第四电池工厂选址,并继续沿用与车企合资的合作模式。这一动态标志着宁德时代在欧洲市场的布局正在进一步加深。   宁德时代目前在欧洲已经建立了三座电池工厂,各具战略意义。
    的头像 发表于 01-23 14:51 1664次阅读