图灵测试的现实意义,图灵测试本质上是替代测试-电子发烧友网

一个人工智能深度学习的问题，科学家、统一物理学家、神经生物科学家从不同的角度想把深度学习尽可能说清楚，尽可能学术化。对于搞机器专业的人来说，从来都是算法、程序、数据。怎么样通过大量的数据，略微的修改，呈现我们的产品，对我们来说是一个颠覆性的问题。

5月19日，在2018全球人工智能技术大会上，CAAI中国人工智能学会理事长、中国工程院院士李德毅发表了题为“路测的学问--无人驾驶的后图灵测试”的演讲，畅谈了无人驾驶的发展前景。

以下为李德毅院士在本次大会中的演讲实录，经本人同意整理后发布。

李德毅：刚才听了姚先生的报告很有感触，一个人工智能深度学习的问题，科学家、统一物理学家、神经生物科学家从不同的角度想把深度学习尽可能说清楚，尽可能学术化。对于搞机器专业的人来说，从来都是算法、程序、数据。怎么样通过大量的数据，略微的修改，呈现我们的产品，对我们来说是一个颠覆性的问题，所以我觉得很有启发。

今天跟大家讨论另外一个技术性的问题：图灵测试。无人驾驶的车子，大的小的都在路上跑，可能你旁边的车不经意就是无人驾驶，所以讲一讲路测的学问。也就是无人驾驶在后图灵时代的测试是怎么样的。

最近Google发明了机器人打电话，将来你接到的电话你可能搞不清楚是人打的还是机器人打的，这个事情有点麻烦，尤其他它的语音和你原来朋友的语音是一模一样的，怎么办？现在国内外火爆的无人驾驶测试活动，各地区都在建设封闭或半封闭的测试场。这样一来，就要把后图灵时代的图灵测试推向前所未有的高潮期。沉浸了多年的图灵测试不是科学家在做，是全民在做。我想，这可能是阿兰•图灵自己也没有想到的。

一、图灵测试的现实意义

最近有一家公司的共享汽车发生了事故，全民关心。涉及到什么问题？出租车行业的职业道德、职业底线、职业操守的问题。最近又联系到无人驾驶车在全世界死人的问题，大家也很担心。交通部门发出很多的规定，特别是有的地方法规要求，无人驾驶车必须先在封闭环境里安全行驶五千公里才可以上路测试，如果你家里有一个车，跑五千里不算数就耗费掉了，还是挺心疼的。

去年和今年Google发布了他们的自动驾驶路测报告，已经到了一千英里，到明年的时候，机器人一直在问人类，你们为什么还不给我们发驾照？如果发驾照发什么？中国的驾照有A类、B类、C类，开小车的是C照，开大车开的好的可以拿到A照，也不容易。无人驾驶车发什么照？将来是不是发AP照、BP照、CP照？

无人车上路要发驾照已经成为各国交管部门当务之急，已经成为社会的普遍关注。如果图灵还在世，他会怎么做？

1950年，他写了一篇论文登在杂志上，题目是“计算可以思维吗？”我们说是计算的机理和智能，如果测试人看不到人和机器，在密闭的环境里，如果不能区分人和机器，大概就是智能的。2014年，一个聊天机器人尤金•古斯特曼投入了测试。

图灵的这篇文章到底是“机器可以思维吗？”还是“机器能够替代人吗？”这是两个命题。什么叫思维？替代好像好办一点。从图灵描述的图来看，好像是Tester，如果把人和机器分别换上特斯拉的Autopilot和一个真人Human Driver，调换一下，直升机在天上看，你可以看出区别吗？看不出来就说无人驾驶通过了图灵测试，可以吗？所以人类进入了后图灵测试时代。

当客服机器人和我们聊天时，他在听你也在听，他在说你也在说，甚至可以同时问问题、翻译、语音。机器人医生给我们进行远程医疗时，当陪读机器人为孩子做咨询或辅导时，当机器同传能够使得我们和外国朋友直接交谈时，当机器人写作的诗集出版了，著作权人是？法官和法官机器人，谁判决准确率更高？所以机器人已经走入千家万户。

我们人类是拿驾照的，在座会开车的同志们都知道，当你刚拿到驾照时，你跑了五千公里吗？五百都没有，五十公里差不多。你当了1-2年的菜鸟，后来跑了几万公里时你才是老司机。为什么对机器人那么苛刻？

人类社会常年考驾照，测试标准和测试环境已经能够清楚界定，加以驾驶行为大数据可以精准收集，评测结果较为客观。国内的这些人拿驾照，考官都不在现场，都在房子里看你有没有碰到杆子。已经积累了丰富的测试经验。

在这样的情况下，3016标准给了我们一个档案，把智能驾驶分六个等级，到L4的时候，就可以不要眼睛和注意力了，到L5时就不要驾驶员了。

自动驾驶的等级转换点如何度量？有的企业说我是3.5，有的说是2.5，怎么度量？当汽车把接管权交给人时，反复说怎么样度量。尤其是第五级，什么叫完全自动？很恶劣的天气，人都不能开，还能完全自动吗？

所以，将来人类怎么样给无人驾驶发驾照？

第一步：在车里配一个安全驾驶员，让无人车自己开，但安全驾驶员有驾照，随时干预。这是目前的状况。

第二步：不要驾照的安全员在车里，可以干预车，但这个安全员本身可以没有驾照。

第三步：共享汽车时乘员不必有驾照，但仍然可以人工指挥，因为我们知道，机器人和人在一起时一定要听人指挥。

按照这个“三步曲”，看图灵测试是多么重要，因为各行各业都需要人，这个机器人应该持照上岗，这个“照”谁来发？

二、图灵测试本质上是替代测试

图灵测试本质上不是智能测试，是替代测试，是机器人能不能替代人的工作。无人驾驶难在拟人，我们有马车的时候，觉得马车不够快换了汽车。虽然汽车开的快，但有的时候不如马，因为老马识途，汽车没有地图怎么回去？当我们讨论L2是辅助驾驶，L3是自动驾驶时，L3的基本问题到底是放在车上还是人上？如果放在车上，就要让车企的同志们把车越做越好。我最近访问了一个博士，他是做底层设计的，要在中国做线控的自动改造，我们把车子越做越好，像特斯拉一样，做一个软件定义的机器人，要自动驾驶，这是一条龙。我做无人驾驶时，也希望一个好的线控的高精度的自动驾驶的汽车，但我把重点放在解决人的问题上，把驾驶员的认知用机器人替代，是记忆、决策和行为能力的认知主体。长期以来，我们有一个词不停说，那就是Agency。有的中文都不翻译Agency，其实本意就叫代理。实际上我们现在做的就是做一个驾驶员的智能代理，实现智能驾驶，希望这个代理有驾驶的技巧，还有驾驶的个性。

汽车的行为由驾驶员决定，无人驾驶难在拟人，要研究驾驶员的行为学和心理学，物化驾驶员的感知、决策、记忆、控制和行为技巧，而不是一味地改进车辆动力学性能，实现自动驾驶！最近我们的团队在天津港用卡车做了一个精准定位，以前我们做一个精准定位，无论是空的还是满载，大概误差在20厘米。港口的装机场要求准确落在无人驾驶卡车上，提出5厘米的定位要求。其实集装箱的大卡车很难到5厘米。所以做好无人驾驶，既要有好的车，更要有好的驾驶员的智能代理。

我们曾经在常熟自然科学基金委组织了多次比赛，提出“4S”评测标准，开车要Smooth、安全Smart、Safety、Speed。从这个角度上来说，我们已经做了大量的工作。

各省都在建测试场，什么时候我们身边来一个无人驾驶车，开车的人不再惊讶，可以跟他很轻松、友好的进行交互。

三、图灵测试本质上是交互智能测试

图灵先生提出用对话的方式考虑一个机器的语言智能。把机器人的记忆智能和计算智能藏了起来，当前的聊天机器人把对话交互方式推向了高潮。

在开车过程当中，驾驶员与环境和周边车辆有没有交互？我认为是有的，必须不时的与环境和周边车辆进行交互，驾驶员的经验和临场处置能力必须能够体现。我们为此在交互认识之上做了很多的工作，首先研究了无人驾驶基于语言的交互。无人驾驶车面对复杂、不确定的周围环境，可以通过智能音箱、手机和互联网的方式，进行语音、语义等自然语言的理解，与车主、乘员、运行维护人员、远程约车请求等进行不同人群之间的交互。

无人驾驶要能够响应远程车主的干预，因为车主是这个车子的主人，还要能够响应约车的请求。运维人员可以远程在线干预无人驾驶车，研发人员可以利用特定的接口，与无人驾驶进行交互，监控车辆实时状态，完成调试工作。无人驾驶车还要能够识别周边人群的肢体语言，例如现场执勤的交警，你必须服从它。行人要坐你的车，可能看你比较远，用手势来表达，你也必须能理解。

超车并道在无人驾驶中是一个难点，尤其当低速车道汇入高速车道比较难。我们做了一个例子，例如有四个红车是有人驾驶，一个灰色的车辆是无人驾驶，怎么换道？一定不时跟你周边几个车辆用打灯、按喇叭或者踩油门、刹车的方式告诉周边的人，如果他跟你协作，你超车并道了。

无人驾驶车辆的交互，我们已经在宇通公交客车和天津港的集卡上做了初步实现，在刚刚召开的天津2018世界智能大会上获得交互组的领军奖。现在都不讲冠军、亚军或季军，冠军叫领军奖，亚军叫领先奖，季军叫优秀奖。

四、图灵测试本质上是不确定性智能测试

图灵测试有没有漏洞？几十年来，大家为图灵测试开了多少次会？我发现一个漏洞，因为图灵测试要求测试人是主体，如果被测试的一方支支吾吾、保持沉默或者主动插话介入，就可能抢过了话语权，颠覆了测试者的主导定位。就像青年人去面试，本来老板考他，他很厉害，考了老板。就很难区分对方到底是人还是机器人，再一次暴露出图灵测试的瑕疵。

图灵测试对话过程中充满了不确定性，例如聊天本来是浅层次、短时长的对话，也是最通用的对话，有的就是为了消磨时间、客气、礼貌，充满了不确定性，总是在讲一些所谓的废话，其实废话不废，它带来了亲和感，在社交生活中不可或缺，不会聊天的对话机器人，人们会觉得它太乏味。所以不要完全从负面看。

不确定性智能测试表现在：对话的语境和语用、情感的交互、交互环境的不确定性。我们必须研究不确定性智能的客观性、普遍性和积极意义，寻找不确定性中的基本确定。

驾驶员曾经开过这样的车，想换道，结果后面的车子不让你，你开了一半又回来了。这种情况还是经常有的。总共有五种情况，首先常见的就是生成超车并道，成功了。也有超车过程中，中途放弃换道，回到原车道。也有强性换道，不换也得换，等等。

无人泊车过程中有很多的不确定性，尤其是非常规的泊车，我们叫边缘泊车。大家都说无人驾驶难在最后一公里，因为它把人放下之后，往哪里去？很多的选择，加油站、停车场？我个人认为，应该把最后一公里当做最先一公里来解决，否则老百姓不接受。

人工智能的使命就是加速汽车向可交互的轮式机器人的转变。

目前全国各地火爆的智能驾驶专用实验场和评估环境，很可能发展成为人与轮式机器人比赛驾驶智能的实验场，发展成为赛车手和赛车机器人角逐冠军的比赛场，发展成为后图灵时代的图灵测试场。

我们一般看车就是看底盘大架、发动机，底盘就是看它的手和脚，实际上是驾驶人力量的延伸。发动机就相当于心脏。而我们加了传感器、指纹，等于加了一个智能代理。因此有可能使得汽车成为我们驾驶员自己，这应该是人工智能时代最有意义的科学课题，再一次彰显了图灵测试的意义。

机器人全人带来了一个新的行业，就是后图灵时代的图灵测试应该考虑人机共生、共融、共发展的测试方法学和测试标准的时候了。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

无人驾驶

无人驾驶

+关注

关注
97

文章
3879

浏览量
118963
深度学习

深度学习

+关注

关注
73

文章
5236

浏览量
119899
图灵测试

图灵测试

+关注

关注
1

文章
7

浏览量
7323

原文标题：李德毅院士：路测的学问--无人驾驶的后图灵测试

文章出处：【微信号：IV_Technology，微信公众号：智车科技】欢迎添加关注！文章转载请注明出处。

如何使用EMC测试软件执行辐射抗扰度测试？（一）测试方法

同的方法来生成该字段。德思特RadiMation®测试软件支持以下四种不同的辐射抗扰度测试方法： ● 替代法 ● 场强固定法 ● 固定功率法 ● 三板测试法（汽车行业） ● 最低性能法

发表于 03-11 15:03 •253次阅读

如何使用EMC<b class='flag-5'>测试</b>软件执行辐射抗扰度<b class='flag-5'>测试</b>？（一）<b class='flag-5'>测试</b>方法

电路板振动测试的测试方法

电子元件的松动、断裂、焊接点破坏等问题，从而影响到电路板的正常运行。因此，进行振动测试可以帮助我们评估电路板的可靠性，提前发现潜在的问题并采取相应的措施来改进产品质量。一、振动测试的目的和意义振动

发表于 02-01 15:48 •600次阅读

光伏IV曲线测试的原理及意义

光伏IV测试作为评估光伏电池性能的重要手段，对光伏技术的发展和应用起着关键的作用。通过光伏组件IV测试，我们可以准确地评估光伏电池的转换效率和功率输出，为光伏系统的设计、优化和性能监测提供重要的参考依据。未来，随着光伏技术的不断发展，光伏IV

发表于 01-10 14:37 •638次阅读

图灵机模型的组成部分及作用

图灵机是图灵提出的一种抽象的计算模型，被认为是计算机科学的基础。在图灵机模型中，包含了以下几个组成部分：输入带、读写头、状态集合、转移函数以及输出。首先，输入带是图灵机的数据存储器，

发表于 12-20 17:23 •1203次阅读

变压器变比测试仪的作用意义

变压器变比测试仪对于变压器变比的检测有着重要的作用意义。

发表于 12-13 15:02 •303次阅读

高速ADC的特征测试和生产测试方法

本应用笔记将介绍ADI公司高速转换器部门用来评估高速ADC的特征测试和生产测试方法。本应用笔记仅供参考，不能替代产品数据手册。动态测试硬件设置 SNR、SINAD、最差杂散和IMD均

发表于 11-28 16:32 •1次下载

高速ADC的特征<b class='flag-5'>测试</b>和生产<b class='flag-5'>测试</b>方法

什么是人工智能？人工智能背后的技术原理和应用

图灵测试在 20 世纪 50 年代已经提出，那时没有计算机。图灵测试指测试者与被测试者（一个人或

发表于 11-18 09:25 •386次阅读

半导体可靠性测试有哪些测试项目？测试方法是什么？

可靠性测试是半导体器件测试的一项重要测试内容，确保半导体器件的性能和稳定性，保证其在各类环境长时间工作下的稳定性。半导体可靠性测试项目众多，测试

发表于 11-09 15:57 •985次阅读

半导体测试概述

传统意义的半导体测试指基于ATE机台的产品测试，分为wafer level的CP测试(chip probing）或FE测试（FrontEnd

发表于 11-06 15:33 •3181次阅读

芯片的CP测试&FT测试相关术语

对于测试项来说，有些测试项在CP时会进行测试，在FT时就不用再次进行测试了，节省了FT测试时间，但也有很多公司只做FT不做CP（如果FT和封

发表于 11-01 10:32 •1050次阅读

光伏测试仪器进行组件安规测试的目的和意义

随着光伏产业的快速发展，光伏组件的安全性和可靠性已成为一个十分重要的问题。为了确保光伏组件在使用过程中的安全性和可靠性，需要进行安规测试。本文将为您介绍光伏组件安规测试的目的和意义。

发表于 10-23 14:22 •320次阅读

什么是芯片测试座？芯片测试座的选择和使用

芯片测试座，又称为IC测试座、芯片测试夹具或DUT夹具，是一种用于测试集成电路（IC）或其他各种类型的半导体器件的设备。它为芯片提供了一个稳定的物理和电气接口，使得在不造成芯片或

发表于 10-07 09:29 •958次阅读

什么是可测试性设计可测试性评估详解

可测性设计(DFT)之可测试性评估详解可测试性设计的定性标准：测试费用：一测试生成时间 -测试申请时间 -故障覆盖一

发表于 09-01 11:19 •519次阅读

从软件测试白盒测试实例分析

白盒测试是关注测试用例覆盖程序逻辑（源代码）的程度。最终的白盒测试是执行程序中的每个路径。但对于大多数的程序（例如带有循环的程序），完全意义上的全路径覆盖是不

发表于 08-20 14:44 •819次阅读

一个问题区分人类和AI！「丐版」图灵测试，难住所有大模型

而人类能轻易地把「大写字母」单词剔除问题，识别出藏在混乱的大写字母中的真正问题，做出回答，从而通过测试。图中的问题本身非常简单：is water wet or dry？

发表于 06-06 15:19 •542次阅读