0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

特斯拉AI总监Karpathy亲自揭秘特斯拉纯视觉系统

新机器视觉 来源:机器之心 作者:机器之心 2021-06-25 11:29 次阅读

在 2021 年计算机视觉与模式识别大会上,特斯拉AI 高级总监 Andrej Karpathy 分享了一些特斯拉在过去几个月中所做的事情,会上 Karpath 阐明了特斯拉在自动驾驶领域的重要性,并介绍了该公司最新超级计算机等相关内容。

在自动驾驶领域,传感器的问题一直分为视觉派和激光雷达派。特斯拉 CEO 伊隆 · 马斯克是坚定的视觉派,他曾多次 diss 激光雷达,认为它「很荒唐,注定要失败」。

近日,在 CVPR 2021 线上自动驾驶研讨会(WAD)上,特斯拉人工智能高级总监 Andrej Karpathy 发表了主题演讲,揭秘了特斯拉如何训练 100% 的纯视觉自动驾驶神经网络

在演讲中,Karpathy 谈到了特斯拉在过去几个月中所做的一些事情。首先他阐明了特斯拉在自动驾驶领域的重要性,并指出:当前「社会交通方面状况不佳」,指的是这些由金属制成的车辆在人类的控制下以高动能快速行驶——或者就像他所描述的:受人肉(Meat computer use in today’s transportation)控制。

此外,Karpathy 还透露了该公司的最新超级计算机。该计算机允许汽车制造商放弃雷达和激光雷达等辅助设备,完全依赖高质量的光学摄像机实现自动驾驶。

Karpathy 阐述了目前交通环境中「人类驾驶员」的几个简单事实:

人们通常以 80mph 的速度驾驶重量大约一吨的汽车,可能存在 250ms 的反应延迟,而驾驶员需要转头和使用后视镜来查看交通状况,有时他们甚至不能注意力完全集中。此外,调查发现:

全球每天有约 3700 人死于车祸;

交通运输成本较高。

Karpathy 表示:「归根结底是人本身并不擅长驾驶,会造成一些交通事故。我们希望实现交通自动化,并让整个人类社会受益。」

他指出,使用计算机芯片代替人类驾驶在安全性和便利性方面都有很多好处:

同样以 80mph 的速度为例,使用计算机芯片控制驾驶,反应延迟《《100 毫秒,可以进行 360 度的感知,并且「计算机驾驶员」在驾驶过程中是全神贯注的。因此,自动驾驶未来会减少交通事故,并大幅降低交通运输成本。

特斯拉的独特之处

Karpathy 进一步阐述了特斯拉在自动驾驶方面的独特之处:「我们采取循序渐进的方法来实现自动驾驶。特别是我们已经拥有了使用 Autopilot 包的客户和数百万辆汽车,Autopilot 软件一直在运行,并完善了一些保障安全的功能,当然也包括 Autopilot 功能。在我们为客户提供安全和便利的同时,我们的团队正在开发完全自动驾驶(Full Self-Driving,FSD)功能。」

Karpathy 在演讲中播放了一段演示自动紧急制动的视频。当司机开过一个十字路口时,一个行人突然出现了。汽车检测到行人后,目标检测启动,猛踩刹车以避免碰撞。

下一个演示是一个交通管制警告的例子,该例子显示司机分心了,他可能在看手机,没有因为前面的红绿灯变红而刹车。而车子检测到了红灯,因此它发出警告声,司机开始减速。

接下来的两个视频是踏板误踩补救机制 (Pedal Misapplication Mitigation,PMM) 的示例。在第一个示例中,驾驶员正在停车并试图转弯。然而,他犯了一个错误踩下油门而不是刹车。此时自动驾驶系统启动,检测到行人,突然刹车。

Karpathy 展示的最后一个场景是另一个司机试图停车。司机向右转,以为在踩刹车然而他踩的是油门,此时系统启动制动,阻止了事故的发生。

Karpathy 还展示了特斯拉在旧金山自动导航的另一个视频,并指出他展示了所有的预测——你可以看到的线条和物体,表明系统也看到了相同的东西。

这些都说明计算机控制的自动驾驶能够比人类驾驶员做得更好,Karpathy 说:「作为工程师,我们当然会推广自动驾驶,对我们来说,零干预驱动实际上是相当常规的,尤其在人口稀少的地区。」

值得注意的是,特斯拉不同于其他自动驾驶公司,他们采用的是纯视觉系统。

视觉 VS 雷达,该选哪一个

「这是一个在十字路口左转的 Waymo,这个视频为什么这么令人印象深刻?我想强调的一点是,尽管视觉和雷达两种情况看起来是一样的——有一辆车在十字路口左转,但就系统的可扩展性而言,情况却大不相同。」Karpathy说道。

所以,行业中很多竞争的方法都采用了这种激光雷达 + 高清地图的方法。

Karpathy 解释说,使用雷达的系统必须用激光雷达传感器预先绘制环境地图,同时还要制作高清地图。他们还必须插入所有的车道,红绿灯,在测试时,车辆需要定位到地图上,以便驾驶。

雷达传感器已经广泛地应用在很多乘用车和卡车当中,通过无线电波技术,即便在能见度差的情况下也能检测快速接近的物体,是为汽车驾驶安全提供保障的传感器之一。

但特斯拉公司表示北美市场的 Model 3 和 Model Y 车辆的辅助驾驶 AutoPilot 系统中,将放弃使用雷达传感器,转而聚焦摄像头视觉为中心的解决方案。他们将依靠摄像头视觉系统和神经网络处理来实现「Autopilot、全自动驾驶(FSD)和某些主动安全功能。」

Karpathy 说:「我们采取的方法主要是基于视觉,依靠 8 个环绕车身并能够覆盖 360° 的摄像头。所以我们第一次来到一个十字路口,我们必须弄清楚车道在哪里,它们如何连接,交通灯在哪里,哪些是相关的,什么交通灯控制什么车道,所有的事情都发生在当下,发生在那辆车上,我们之前并没有高清地图等信息。」

Karpathy 表示这是一种更具可扩展性的方案,基于此他们需要一个能够预测速度、加速度等信息的神经网络,首先需要一个满足以下条件的数据集:

包含数百万视频的大型数据集;

经过预处理,带有多种标签的高质量数据集;

该数据集要丰富多样,包含一些边缘样例。

Karpathy 进一步介绍了特斯拉的数据引擎:

最终他们得到了一个包含一百万条视频,60 亿对象标签的数据集,该数据集后续还将继续完善更新。

接下来,研究团队需要在这个超大型数据集上构建一个神经网络。这个神经网络将是一个通用的视觉系统,原则上可以部署在任何需要的地方。这也是特斯拉研发团队正在做的事情。

使用上述方案,特斯拉能够规避「突然减速」问题和基于雷达的系统的信号中断,提供平稳的驾驶状态。

Karpathy 解释说,特斯拉在过去几年里构建的视觉系统非常好,比其他传感器都要好。摄像头承担了感知方面的大部分工作,现在特斯拉正在移除一些传感器,因为这些传感器正在成为不必要的辅助。

「三周前,我们开始运送完全没有雷达的汽车。我们脱离了雷达,只靠视觉驾驶这些车。而我们这样做的原因,正如伊隆在推特上所表达的,『当雷达和视觉不一致时,你相信哪一个?视觉的精确度要高得多,因此,与其进行传感器融合,不如在视觉方面加大投入。』」

在演讲中,Karpathy 还展示了特斯拉完全自动驾驶(FSD)芯片

此外,Karpathy 还讲解了特斯拉的超级计算机集群,也是特斯拉即将推出的新超级计算机 Dojo 的「先行版本」。特斯拉声称该新集群具有一些相当疯狂的参数,应该会使其成为全球第五的计算机:

720 个 80GB 8x A100 节点(共 5760 个 GPU);

1.8 EFLOPS(720 节点 * 312 TFLOPS-FP16-A100 * 8 gpu / 节点);

10 PB「热层」NVME 存储 @ 1.6 TBps;

总交换容量为 640 Tbps。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2525

    文章

    48129

    浏览量

    740204
  • 计算机视觉
    +关注

    关注

    8

    文章

    1600

    浏览量

    45631
  • 激光雷达
    +关注

    关注

    961

    文章

    3662

    浏览量

    186784
  • 自动驾驶
    +关注

    关注

    773

    文章

    13060

    浏览量

    163240

原文标题:AI总监Karpathy亲自揭秘特斯拉纯视觉系统,还有自动驾驶超算Dojo原型

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Cognex发布了In-Sight® L38 3D视觉系统,为3D检测设立新标准

    人工智能(AI)驱动的3D视觉系统为自动化制造提供快速部署和可靠的检测功能。
    的头像 发表于 04-15 09:04 141次阅读

    特斯拉股价跌超5% 特斯拉市值一夜蒸发3300亿

    特斯拉股价跌超5% 特斯拉市值一夜蒸发3300亿 近两日特斯拉的股价跌连续下超,目前市值特斯拉的不足6000亿美元。 周一特斯拉的股价跌逾7
    的头像 发表于 03-06 14:25 326次阅读

    特斯拉自动雨刷系统将升级

    针对这些意见,特斯拉成立了由Yun-Ta Tsai领导的团队,正在积极筹备升级版自动雨刷系统。值得注意的是,近期已有特斯拉车主在社交平台提出相关问题,特斯拉对此回应预告称,新版本更新预
    的头像 发表于 02-20 10:28 246次阅读

    不止特斯拉,大疆的智能驾驶也主打纯视觉

    电子发烧友网报道(文/周凯扬)自从特斯拉宣布北美、欧洲等特定地区车型将陆续取消超声波雷达以来,对纯视觉智驾方案的讨论就没有平息过。不少人认为纯视觉方案多为降低成本的妥协方案,要想实现 L3+级别以上
    的头像 发表于 12-21 09:00 1321次阅读
    不止<b class='flag-5'>特斯拉</b>,大疆的智能驾驶也主打纯<b class='flag-5'>视觉</b>

    机器视觉系统中前光源与背光源的应用实例

    在机器视觉系统中光源是关键组成部分之一,在机器视觉系统中具有十分重要的作用。
    的头像 发表于 11-14 11:10 424次阅读
    机器<b class='flag-5'>视觉系统</b>中前光源与背光源的应用实例

    立体视觉系统的设计方案

    电子发烧友网站提供《立体视觉系统的设计方案.pdf》资料免费下载
    发表于 11-06 10:17 0次下载
    立体<b class='flag-5'>视觉系统</b>的设计方案

    基于Linux的嵌入式视觉系统设计原理

    电子发烧友网站提供《基于Linux的嵌入式视觉系统设计原理.pdf》资料免费下载
    发表于 10-11 11:26 0次下载
    基于Linux的嵌入式<b class='flag-5'>视觉系统</b>设计原理

    机器视觉系统基本原理及应用分类

    机器视觉(machine vision)是由计算机或图像处理器以及相关设备来模拟人的视觉行为,完成得到人的视觉系统所得到的信息。 简单说来,机器视觉就是用机器代替人眼来做测量和判断。
    发表于 10-08 10:40 380次阅读
    机器<b class='flag-5'>视觉系统</b>基本原理及应用分类

    视觉系统的构成 机器视觉中常用的接口有哪些

    从机器视觉的定义可以推测出,一个摄像机和一个处理器结合在一起形成一个视觉系统。然而,这只是部分完整的描述。确实,视觉系统需要摄像机和处理器,但还有更多的组成部分。
    发表于 09-05 10:02 513次阅读
    <b class='flag-5'>视觉系统</b>的构成 机器<b class='flag-5'>视觉</b>中常用的接口有哪些

    特斯拉AI总监Andrej Karpathy:大模型有内存限制,这个妙招挺好用!

    为了让大家更好的理解 Karpathy 的内容。我们先介绍一下「Speculative decoding」方法,对后续理解更加有益,其主要用于加速大模型的推理。据了解,GPT-4 泄密报告也提到了 OpenAI 线上模型推理使用了它(不确定是否 100%)。
    的头像 发表于 09-04 15:43 455次阅读
    <b class='flag-5'>特斯拉</b>前<b class='flag-5'>AI</b><b class='flag-5'>总监</b>Andrej <b class='flag-5'>Karpathy</b>:大模型有内存限制,这个妙招挺好用!

    一套简单的机器视觉系统包括哪些部分?

    一套最简单的机器视觉系统包括:视觉成像部分、图像处理部分、运动控制部分。
    发表于 08-20 09:39 418次阅读

    特斯拉ModelY降价超2万 特斯拉modely降价历史表分享

    特斯拉ModelY降价超2万 特斯拉modely降价历史表分享 特斯拉放大招了,不愧是电动汽车卷王之王,特斯拉ModelY降价卷出新高度了,特斯拉
    的头像 发表于 08-14 11:56 7851次阅读

    特斯拉人形机器人将亮相上海

    公司在2023年开始生产的一款人形机器人。擎天柱机器人采用了特斯拉汽车的电池组、冷却系统等技术;还有与特斯拉汽车一样的视觉感知,使用摄像头输入数据,以神经网络进行计算。并搭载了
    的头像 发表于 06-30 19:26 1078次阅读

    机器视觉系统包括哪些

    机器视觉系统包括哪些 机器视觉系统就是利用机器代替人眼来作各种测量和判断。它是计算机学科的一个重要分支,它综合了光学、机械、电子、计算机软硬件等方面的技术,涉及到计算机、图像处理、模式识别、人工智能
    发表于 06-29 11:33 605次阅读

    一套完整的机器视觉系统的工作流程有哪些?

    机器视觉系统的工作流程
    的头像 发表于 06-06 15:17 1638次阅读
    一套完整的机器<b class='flag-5'>视觉系统</b>的工作流程有哪些?