0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

特斯拉AI总监Karpathy亲自揭秘特斯拉纯视觉系统

新机器视觉 来源:机器之心 作者:机器之心 2021-06-25 11:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在 2021 年计算机视觉与模式识别大会上,特斯拉AI 高级总监 Andrej Karpathy 分享了一些特斯拉在过去几个月中所做的事情,会上 Karpath 阐明了特斯拉在自动驾驶领域的重要性,并介绍了该公司的最新超级计算机等相关内容。

在自动驾驶领域,传感器的问题一直分为视觉派和激光雷达派。特斯拉 CEO 伊隆 · 马斯克是坚定的视觉派,他曾多次 diss 激光雷达,认为它「很荒唐,注定要失败」。

近日,在 CVPR 2021 线上自动驾驶研讨会(WAD)上,特斯拉人工智能高级总监 Andrej Karpathy 发表了主题演讲,揭秘了特斯拉如何训练 100% 的纯视觉自动驾驶神经网络

在演讲中,Karpathy 谈到了特斯拉在过去几个月中所做的一些事情。首先他阐明了特斯拉在自动驾驶领域的重要性,并指出:当前「社会交通方面状况不佳」,指的是这些由金属制成的车辆在人类的控制下以高动能快速行驶——或者就像他所描述的:受人肉(Meat computer use in today’s transportation)控制。

此外,Karpathy 还透露了该公司的最新超级计算机。该计算机允许汽车制造商放弃雷达和激光雷达等辅助设备,完全依赖高质量的光学摄像机实现自动驾驶。

Karpathy 阐述了目前交通环境中「人类驾驶员」的几个简单事实:

人们通常以 80mph 的速度驾驶重量大约一吨的汽车,可能存在 250ms 的反应延迟,而驾驶员需要转头和使用后视镜来查看交通状况,有时他们甚至不能注意力完全集中。此外,调查发现:

全球每天有约 3700 人死于车祸;

交通运输成本较高。

Karpathy 表示:「归根结底是人本身并不擅长驾驶,会造成一些交通事故。我们希望实现交通自动化,并让整个人类社会受益。」

他指出,使用计算机芯片代替人类驾驶在安全性和便利性方面都有很多好处:

同样以 80mph 的速度为例,使用计算机芯片控制驾驶,反应延迟《《100 毫秒,可以进行 360 度的感知,并且「计算机驾驶员」在驾驶过程中是全神贯注的。因此,自动驾驶未来会减少交通事故,并大幅降低交通运输成本。

特斯拉的独特之处

Karpathy 进一步阐述了特斯拉在自动驾驶方面的独特之处:「我们采取循序渐进的方法来实现自动驾驶。特别是我们已经拥有了使用 Autopilot 包的客户和数百万辆汽车,Autopilot 软件一直在运行,并完善了一些保障安全的功能,当然也包括 Autopilot 功能。在我们为客户提供安全和便利的同时,我们的团队正在开发完全自动驾驶(Full Self-Driving,FSD)功能。」

Karpathy 在演讲中播放了一段演示自动紧急制动的视频。当司机开过一个十字路口时,一个行人突然出现了。汽车检测到行人后,目标检测启动,猛踩刹车以避免碰撞。

下一个演示是一个交通管制警告的例子,该例子显示司机分心了,他可能在看手机,没有因为前面的红绿灯变红而刹车。而车子检测到了红灯,因此它发出警告声,司机开始减速。

接下来的两个视频是踏板误踩补救机制 (Pedal Misapplication Mitigation,PMM) 的示例。在第一个示例中,驾驶员正在停车并试图转弯。然而,他犯了一个错误踩下油门而不是刹车。此时自动驾驶系统启动,检测到行人,突然刹车。

Karpathy 展示的最后一个场景是另一个司机试图停车。司机向右转,以为在踩刹车然而他踩的是油门,此时系统启动制动,阻止了事故的发生。

Karpathy 还展示了特斯拉在旧金山自动导航的另一个视频,并指出他展示了所有的预测——你可以看到的线条和物体,表明系统也看到了相同的东西。

这些都说明计算机控制的自动驾驶能够比人类驾驶员做得更好,Karpathy 说:「作为工程师,我们当然会推广自动驾驶,对我们来说,零干预驱动实际上是相当常规的,尤其在人口稀少的地区。」

值得注意的是,特斯拉不同于其他自动驾驶公司,他们采用的是纯视觉系统。

视觉 VS 雷达,该选哪一个

「这是一个在十字路口左转的 Waymo,这个视频为什么这么令人印象深刻?我想强调的一点是,尽管视觉和雷达两种情况看起来是一样的——有一辆车在十字路口左转,但就系统的可扩展性而言,情况却大不相同。」Karpathy说道。

所以,行业中很多竞争的方法都采用了这种激光雷达 + 高清地图的方法。

Karpathy 解释说,使用雷达的系统必须用激光雷达传感器预先绘制环境地图,同时还要制作高清地图。他们还必须插入所有的车道,红绿灯,在测试时,车辆需要定位到地图上,以便驾驶。

雷达传感器已经广泛地应用在很多乘用车和卡车当中,通过无线电波技术,即便在能见度差的情况下也能检测快速接近的物体,是为汽车驾驶安全提供保障的传感器之一。

但特斯拉公司表示北美市场的 Model 3 和 Model Y 车辆的辅助驾驶 AutoPilot 系统中,将放弃使用雷达传感器,转而聚焦摄像头视觉为中心的解决方案。他们将依靠摄像头视觉系统和神经网络处理来实现「Autopilot、全自动驾驶(FSD)和某些主动安全功能。」

Karpathy 说:「我们采取的方法主要是基于视觉,依靠 8 个环绕车身并能够覆盖 360° 的摄像头。所以我们第一次来到一个十字路口,我们必须弄清楚车道在哪里,它们如何连接,交通灯在哪里,哪些是相关的,什么交通灯控制什么车道,所有的事情都发生在当下,发生在那辆车上,我们之前并没有高清地图等信息。」

Karpathy 表示这是一种更具可扩展性的方案,基于此他们需要一个能够预测速度、加速度等信息的神经网络,首先需要一个满足以下条件的数据集:

包含数百万视频的大型数据集;

经过预处理,带有多种标签的高质量数据集;

该数据集要丰富多样,包含一些边缘样例。

Karpathy 进一步介绍了特斯拉的数据引擎:

最终他们得到了一个包含一百万条视频,60 亿对象标签的数据集,该数据集后续还将继续完善更新。

接下来,研究团队需要在这个超大型数据集上构建一个神经网络。这个神经网络将是一个通用的视觉系统,原则上可以部署在任何需要的地方。这也是特斯拉研发团队正在做的事情。

使用上述方案,特斯拉能够规避「突然减速」问题和基于雷达的系统的信号中断,提供平稳的驾驶状态。

Karpathy 解释说,特斯拉在过去几年里构建的视觉系统非常好,比其他传感器都要好。摄像头承担了感知方面的大部分工作,现在特斯拉正在移除一些传感器,因为这些传感器正在成为不必要的辅助。

「三周前,我们开始运送完全没有雷达的汽车。我们脱离了雷达,只靠视觉驾驶这些车。而我们这样做的原因,正如伊隆在推特上所表达的,『当雷达和视觉不一致时,你相信哪一个?视觉的精确度要高得多,因此,与其进行传感器融合,不如在视觉方面加大投入。』」

在演讲中,Karpathy 还展示了特斯拉完全自动驾驶(FSD)芯片。

此外,Karpathy 还讲解了特斯拉的超级计算机集群,也是特斯拉即将推出的新超级计算机 Dojo 的「先行版本」。特斯拉声称该新集群具有一些相当疯狂的参数,应该会使其成为全球第五的计算机:

720 个 80GB 8x A100 节点(共 5760 个 GPU);

1.8 EFLOPS(720 节点 * 312 TFLOPS-FP16-A100 * 8 gpu / 节点);

10 PB「热层」NVME 存储 @ 1.6 TBps;

总交换容量为 640 Tbps。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2578

    文章

    55892

    浏览量

    795759
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47780
  • 激光雷达
    +关注

    关注

    984

    文章

    4612

    浏览量

    197456
  • 自动驾驶
    +关注

    关注

    795

    文章

    15070

    浏览量

    182060

原文标题:AI总监Karpathy亲自揭秘特斯拉纯视觉系统,还有自动驾驶超算Dojo原型

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    特斯拉AI芯片战略升级,“史诗级”芯片接棒Dojo

    电子发烧友网报道(文/黄山明)近期,特斯拉CEO马斯克在社交媒体上发文称,特斯拉AI5芯片设计团队已完成出色的设计评审,并表示这款芯片将成为“史诗级”产品,并且接下来推出的AI6也有望
    的头像 发表于 09-09 09:01 7873次阅读

    都是视觉智驾,小鹏和特斯拉技术上有何区别?

    [首发于智驾最前沿微信公众号]在自动驾驶的技术路径中,视觉一直是非常重要的方向,在之前的内容中,我们探讨过小鹏汽车转向视觉的技术底气,还聊过特斯
    的头像 发表于 05-25 09:50 235次阅读
    都是<b class='flag-5'>纯</b><b class='flag-5'>视觉</b>智驾,小鹏和<b class='flag-5'>特斯拉</b>技术上有何区别?

    康耐视发布In-Sight 3900视觉系统:边缘AI检测速度提升4倍

    2026年5月5日,全球工业机器视觉领导者康耐视(Cognex Corporation,纳斯达克代码:CGNX)正式推出In-Sight® 3900视觉系统。该产品基于康耐视新一代嵌入式AI
    的头像 发表于 05-11 09:44 1379次阅读

    特斯拉AI5芯片流片成功:自动驾驶与人形机器人迎来算力革命

    2026年4月,特斯拉CEO埃隆·马斯克在社交平台宣布,特斯拉下一代AI5芯片已成功完成流片,标志着这一颠覆性硬件正式进入量产倒计时。作为特斯拉全栈自研战略的里程碑,
    的头像 发表于 04-23 10:03 2365次阅读

    工业视觉系统中工业相机的选型维度

    工业视觉系统中工业相机的选型维度
    的头像 发表于 04-14 17:35 589次阅读
    工业<b class='flag-5'>视觉系统</b>中工业相机的选型维度

    机器视觉系统之工业相机解读

    机器视觉系统是一种模拟人类视觉功能,通过光学装置和非接触式传感器获取图像数据,并进行分析和处理,以实现对目标物体的识别、测量、检测和定位等功能的智能化系统。其目的是让机器能够理解和解释视觉
    的头像 发表于 02-11 17:02 772次阅读
    机器<b class='flag-5'>视觉系统</b>之工业相机解读

    比亚迪首次超越特斯拉,全球电销量第一!

    2024年,特斯拉以约2万辆的微弱优势领先于比亚迪,而2025年比亚迪销量大幅超越特斯拉。比亚迪此次超越特斯拉,意味着其有望凭借规模优势强化零部件采购能力,进一步提升价格竞争力。
    的头像 发表于 01-04 17:11 576次阅读

    机器视觉系统中光源的相关行业术语解读

    工业光源在机器视觉系统中扮演着至关重要的角色,机器视觉系统成像过程中选择合适的光源可提升图像质量与特征凸显,应对复杂检测场景,提高检测精度和效率,保证系统的稳定性与可靠性。51camera机器
    的头像 发表于 12-16 17:30 811次阅读
    机器<b class='flag-5'>视觉系统</b>中光源的相关行业术语解读

    机器视觉系统中工业相机的常用术语解读

    1、机器视觉系统机器视觉系统machinevisionsystem是通过对声波、电磁辐射等时空模式进行探测及感知,对所获取的图像进行自动处理、分析和测量,做出定性解释和定量分析,得到有关目标物体
    的头像 发表于 10-31 17:34 1526次阅读
    机器<b class='flag-5'>视觉系统</b>中工业相机的常用术语解读

    机器视觉系统工业相机的成像原理及如何选型

    机器视觉系统是一种模拟人类视觉功能,通过光学装置和非接触式传感器获取图像数据,并进行分析和处理,以实现对目标物体的识别、测量、检测和定位等功能的智能化系统。其目的是让机器能够理解和解释视觉
    的头像 发表于 08-07 14:14 2008次阅读
    机器<b class='flag-5'>视觉系统</b>工业相机的成像原理及如何选型

    机器人也能视觉控制?MIT华人博士团队登上Nature主刊

    电子发烧友网报道(文/梁浩斌)“视觉”的概念在近几年的智能驾驶领域被提到的次数不少,特斯拉、小鹏、以及传闻准备重组的极越,都早已全面押注到“视觉
    的头像 发表于 07-16 00:48 7137次阅读
    机器人也能<b class='flag-5'>纯</b><b class='flag-5'>视觉</b>控制?MIT华人博士团队登上Nature主刊

    特斯拉 Robotaxi 开始载客,技术漏洞引关注

    特斯拉自动驾驶技术商业化进程中的里程碑,标志着视觉方案从技术验证阶段向规模化应用迈出关键一步。   视觉方案的突破与争议
    的头像 发表于 06-25 00:11 8927次阅读

    视觉的自动驾驶会有哪些安全问题?

    强调视觉系统的先进性。视觉自动驾驶是指在车辆自动驾驶系统中仅依赖摄像头而不使用激光雷达或毫米波雷达等主动传感器。特斯拉率先倡导这一路线,宣
    的头像 发表于 06-16 09:56 1290次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b>的自动驾驶会有哪些安全问题?

    斑马技术荣获2025视觉系统设计创新奖

    《Vision Systems Design》举办的Innovators Awards多年来在海外享有盛誉,该奖项旨在表彰在产品或技术、应用程序或研发方面表现卓越的机器视觉行业公司。《视觉系统
    的头像 发表于 06-10 18:01 1302次阅读