数十万公里的数据(自动驾驶汽车面临的难题)

数十万公里的数据(自动驾驶汽车面临的难题)
文章图片

在如今科技高速发展的时代,人工智能正快速跻身于人们的生产生活中,不断为经济社会的发展注入新动力,而自动驾驶(AV)作为近几年的黑科技,已然成为人工智能领域里最重要的方向之一。
自动驾驶系统根据其智能程度可分为多个等级。目前,业界主要采用美国国家公路交通安全管理局和美国高速公路安全管理局对分级标准的定义,将其从低到高依次分为L0、L1、L2、L3、L4与L5,即从无自动化到完全自动化。
说到底自动驾驶是秉承着安全高效的理念为人类服务的。但就目前来看,自动驾驶的等级普遍停留在L2至L3阶段,无人驾驶技术的普及仍是个渐变的过程,可以说L4未来可期,但L5仍遥不可及。当下自动驾驶面临的问题是多方面的,包括商业层面、社会层面及技术层面等等。其中技术问题是制约智能汽车行业发展的最大因素,主要包括恶劣天气、行车安全、隐私保护、基础设施不完善、5G通信尚未成熟、高质量标注数据不足等。
数十万公里的数据(自动驾驶汽车面临的难题)
文章图片

自动驾驶汽车的新燃料
AV是整个人工智能领域中最需要数据支撑的,它们需要接受训练以识别现实世界中可能遇到的对象与环境变量,因此维持自动驾驶汽车所需的数据量是惊人的。目前的统计表明,马斯克口中的5级自动驾驶汽车每小时就需要1至20 TB的数据。因此数据的供应是实现迈向高级自动驾驶汽车的刚需。
数据从何而来?
自动驾驶汽车使用多种设备来识别和解读周围的世界,其中摄像头、激光雷达、毫米波雷达与超声波雷达等传感器是搜集数据的主要仪器,摄像头可用于搜集2D数据,而雷达可完成3D数据记录与测距。为了让自动驾驶汽车应用更广泛,人工智能系统必须使用全球化的数据集进行训练,这包括规则差异、道路标志、地区野生动物、异常障碍和天气条件等方面。
数据如何加工?
单纯的数据对机器是没有帮助的,只有通过人工标注出来才能作为机器的训练素材。鉴于世界各地的驾驶条件千差万别,训练车辆比人类驾驶得更好的唯一方法就是依靠大量数据和人类专业知识的扶持,利用来自数十万公里的个体驾驶员和测试车队的集体见解来保证数据的高质量。准确的数据标注将推动安全的自动驾驶汽车的持续改进。
数十万公里的数据(自动驾驶汽车面临的难题)
文章图片

数据用在哪里?
【数十万公里的数据(自动驾驶汽车面临的难题)】算力、算法与数据是人工智能领域的三大核心技术,数据的存在就是为算力与算法提供原料支撑的,需要通过算力算法研制机器的“大脑”——芯片。但仅靠芯片算力的无限膨胀和硬件预埋是无法一劳永逸的,因为对于车载AI芯片来说,算力指标固然重要,但能效比更重要,在自动驾驶芯片的选用中充分考虑其功耗指标也是每个车企必须考虑的问题。
自动驾驶行进之路
其实目前很多领域自动驾驶早已被应用,比如全自动集装箱码头,地铁,高铁,物流园等。
这些落地的解决方案共同的特征就是交通环境相对简单,可变因素少。但当遇到更为复杂的道路环境时自动驾驶就很难发挥重要作用,例如谷歌的Waymo早在2017年11月的亚利桑那州道路测试中,就把驾驶员座位彻底移除,从而将其技术提升至L4级,但该技术换成在印度的街道中,可能L3级都达不到。
在未来,自动驾驶技术将更上一层楼,为人类科技发展效力。就像百度总裁陆奇博士提出的“母生态”概念:“智能汽车将是继PC、智能手机之后更大的母生态,也是中国汽车行业和科技产业最大的机遇所在。”数据作为自动驾驶的燃料也将助力算力算法技术发展,进一步加速智能汽车产业落地。

    推荐阅读