-
日期: 2021-07-05 | 来源: 网易科技 | 有0人参与评论 | 专栏: 特斯拉 | 字体: 小 中 大
与之相比,特斯拉团队使用了自动标记技术,它结合了神经网络、雷达数据和人工审核。由于数据集是离线标注的,神经网络可以回播视频,将它们的预测与实际情况进行比较,并调整它们的参数。这与所谓的“测试推理”相反,后者所有事情都是实时发生的,深度学习模型无法进行追溯。
离线标记还使工程师能够应用非常强大的、计算密集型的目标检测网络,这些网络无法部署在汽车上,可以用于实时、低延迟的应用程序。他们利用雷达传感器数据进一步验证神经网络的推断。所有这些都提高了标记网络的精度。卡帕西说:“如果你处于离线状态,你就会获得后续好处,可以更好地融合不同的传感器数据。此外,你可以让人类参与进来,他们可以进行清理、验证、编辑等工作。”
不过,卡帕西没有透露对自动标签系统进行最终修改需要多少人力,但人类的认知在引导自动标签系统向正确方向发展方面发挥了关键作用。
在开发数据集的过程中,特斯拉团队发现了超过200个触发点,表明目标检测需要调整。这些问题包括不同摄像头之间或摄像头与雷达之间的检测结果不一致。他们还确定了可能需要特别注意的情况,比如隧道入口和出口,以及顶部有物体的汽车。特斯拉用了四个月的时间来开发和掌握所有这些触发器。随着标签网络的改进,它以“影子模式”部署。这意味着它被安装在消费者的汽车上,静默运行,而不向汽车发出命令,并将该网络的输出与传统网络、雷达和司机的行为进行比较。
特斯拉团队经历了七次数据工程迭代。他们从一个初始数据集开始,在这个数据集上训练他们的神经网络。然后,他们在真实汽车上部署“影子模式”的深度学习,并使用触发器来检测不一致性、错误和特殊场景。然后对错误进行修正,如果需要,还会向数据集添加新数据。卡帕西说:“我们一遍又一遍地重复这个循环,直到神经网络变得足够好。”
因此,该体系结构可以更好地描述为具有巧妙分工的半自动标注系统,其中神经网络负责重复性工作,人类负责解决高级认知问题和罕见情况。
有趣的是,当被问及触发器的生成是否可以自动化时,卡帕西回答说:“触发器的自动化是个非常棘手的问题,因为你可以有通用触发器,但它们不能正确地代表错误模式。例如,很难自动生成具有触发进入和退出隧道功能的触发器,这是人类通过直觉获得的能力,目前还不清楚其具体原理。”
特斯拉的自动驾驶团队需要高效和精心设计的神经网络,以最大限度地利用他们收集的高质量数据集。该公司创建了一个由不同神经网络组成的分层深度学习体系结构,这些神经网络处理信息,并将其输出给下一组网络。
深度学习模型使用卷积神经网络从安装在汽车周围的8个摄像头的视频中提取特征,并使用变换神经网络将它们融合在一起(电视剧)。然后,它会随着时间的推移融合这些信息,这对于轨迹预测和消除推理不一致等任务来说非常重要。然后,空间和时间特征被输入神经网络的分层结构中,卡帕西将其描述为头部、躯干和神经。他说:“你之所以想要这种分层结构,是因为你对大量的输出感兴趣,但你负担不起每个输出都有对应神经网络的代价。”
分层结构使得可以为不同的任务重用组件,并支持不同推理路径之间的特性共享。网络的模块化体系结构的另一个好处是进行分布式开发的可能性。特斯拉目前聘用了一个庞大的机器学习工程师团队,致力于自动驾驶神经网络的研究。他们每个人都在网络的单个小组件上工作,然后把他们的结果插入到更大的网络中。卡帕西称:“我们有个大约20人的团队,他们在全职训练神经网络。它们都在同一个神经网络上合作。”
垂直整合
在CVPR的演讲中,卡帕西分享了特斯拉用来训练和微调其深度学习模型的超级计算机的更多细节。整个计算集群由80个节点组成,每个节点包含8个英伟达A100图形处理器和80 GB显存,总计5760个GPU和超过450 TB的VRAM。这台超级计算机还拥有10PB的NVME超高速存储和640 Tbps的网络容量来连接所有节点,并允许对神经网络进行高效的分布式训练。
特斯拉还拥有并制造安装在其汽车内的AI芯片。卡帕西表示:“这些芯片是专门为我们希望在完全自动驾驶应用中运行的神经网络设计的。”
特斯拉的最大优势是它的垂直整合能力。该公司拥有整个自动驾驶汽车堆栈,自己生产汽车和自动驾驶功能硬件,同时通过从售出的数百万辆汽车中收集各种各样的遥测和视频数据占据独特的位置。特斯拉还利用其专有数据集创建并训练其神经网络,并通过在其汽车上进行影子测试来验证和微调这些网络。当然,特斯拉拥有杰出的团队,由机器学习工程师、研究人员和硬件设计师组成,他们把所有的东西组装在一起。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见