返回
科技

合成数据为自动驾驶汽车铺平了道路

2025-03-28 18:213

根据几年前的乐观预测,自动驾驶汽车现在应该已经在我们的车库里了。但随着自动驾驶出租车的采用率上升,消费者逐渐习惯了车辆中越来越复杂的驾驶辅助系统,我们可能正在接近一些转折点。总部位于硅谷的 Helm.ai 是一家推动发展的公司,该公司为驾驶员辅助系统和全自动驾驶汽车开发软件。

本文引用地址:

该公司为自动驾驶汽车在道路上所需的意图预测和路径规划提供基础模型,还使用生成式 AI 创建合成训练数据,让车辆为许多可能出错的事情做好准备。 IEEE Spectrum 与 Helm.ai 的创始人兼首席执行官 Vladislav Voroninski 就该公司创建合成数据来训练和验证自动驾驶汽车系统进行了交谈。

Helm.ai 如何使用生成式 AI 来帮助开发自动驾驶汽车?

弗拉迪斯拉夫·沃罗宁斯基:我们将生成式 AI 用于模拟目的。那么,给定你观察到的一定数量的真实数据,你能根据这些数据模拟新的情况吗?您希望创建尽可能真实的数据,同时实际提供新内容。我们可以从任何相机或传感器创建数据,以增加这些数据集的多样性,并解决训练和验证的极端情况。

我知道您使用 VidGen 创建视频数据,使用 WorldGen 创建其他类型的传感器数据。不同的汽车公司是否仍然依赖不同的模式?

沃罗宁斯基: 我们的客户肯定对多种模式感兴趣。不是每个人都只想用视力做所有事情。相机相对便宜,而激光雷达系统更昂贵。但我们实际上可以训练模拟器,这些模拟器获取相机数据并模拟激光雷达输出的样子。这可能是节省成本的一种方式。

即使只是视频,在您进行实时驾驶时,也会有一些情况非常罕见或几乎不可能获得,或者太危险而无法获得。因此,我们可以使用生成式 AI 来创建非常非常高质量的视频数据,并且在这些情况下与真实数据基本上没有区别。这也是节省数据收集成本的一种方式。

您如何创建这些不寻常的边缘情况?你说..「现在把一只袋鼠放在路上,现在把一只斑马放在路上”吗?

沃罗宁斯基: 有一种方法可以查询这些模型,让它们产生异常情况 — 这实际上只是整合控制仿真模型的方法。这可以通过文本或提示图像或各种类型的几何输入来完成。这些场景可以明确指定:如果汽车制造商已经有一份他们知道可能发生的情况的清单,他们可以查询这些基础模型来生成这些情况。您还可以做一些更具可扩展性的作,其中有一些探索过程或模拟中发生的情况随机化,这可用于针对各种情况测试您的自动驾驶堆栈。

视频数据的一个好处是,它绝对仍然是自动驾驶的主要模式,您可以使用不仅仅是来自驾驶的视频数据进行训练。因此,当涉及到那些稀有的天体类别时,您实际上可以在许多不同的数据集中找到它们。

那么,如果你有一个动物园里动物的视频数据集,它能帮助驾驶系统识别路上的袋鼠吗?

沃罗宁斯基: 当然,这种数据可以用来训练感知系统来理解这些不同的对象类别。它还可用于模拟传感器数据,将这些对象整合到驾驶场景中。我的意思是,同样,很少有人在现实生活中见过路上的袋鼠。甚至可能在视频中。但这很容易在你的脑海中浮现,对吧?如果你真的看到了它,你就能很快理解它。生成式 AI 的优点在于,如果 [模型] 在不同场景中接触到不同的概念,它可以在新颖的情况下将这些概念组合在一起。它可以在其他情况下观察它,然后将这种理解带到驾驶中。

您如何对合成数据进行质量控制?您如何向客户保证它与真品一样好?

沃罗宁斯基:您可以捕获一些指标,以数字方式评估真实数据与合成数据的相似性。一个例子是你获取一个真实数据的集合,然后你获取一个旨在模拟它的合成数据的集合。你可以对两者进行概率分布拟合。然后,您可以用数字方式比较这些概率分布之间的距离。

其次,我们可以验证合成数据对于解决某些问题有用。你可以说,“我们要解决这个极端情况。您只能使用模拟数据。您可以验证使用模拟数据是否确实解决了问题,并提高此任务的准确性,而无需对真实数据进行训练。

是否有反对者说合成数据永远不够好,无法训练这些系统并教给它们他们需要知道的一切?

沃罗宁斯基: 反对者通常不是 AI 专家。如果你寻找冰球的去向,很明显,仿真将对自动驾驶系统的开发产生巨大影响。此外,一个移动的目标就足够好了,就像 AI 或 AGI [通用人工智能] 的定义一样。做了一些发展,然后人们习惯了它们,“哦,这已经没意思了。一切都是为了接下来的事情。但我认为很明显,基于 AI 的模拟将继续改进。如果你明确希望 AI 系统对某事进行建模,那么此时没有瓶颈。然后,这只是一个问题,即它的推广程度如何。

打赏
  • 0人打赏
    举报
关闭
同类新闻