投稿|特斯拉自动驾驶的底层逻辑

投稿|特斯拉自动驾驶的底层逻辑
文章图片

图片来源@视觉中国

文 | 锦缎
如果机器人有大脑,会是什么样? 
在科幻电影《机械姬》里,全球最大搜索引擎公司“蓝皮书”CEO纳森向观众展示了自己发明的机器人大脑,并留下这么一句话:“人们认为搜索引擎是人们思考的事物,但其实那是人们思考的方式 。”
投稿|特斯拉自动驾驶的底层逻辑
文章图片

该影片上映于 2015 年,被誉为人工智能爱好者必看的电影之一,拿下包括奥斯卡金像奖在内等多项国际电影大奖 。但在众多奖项 中,单项之冠是 “ 最佳女配角 ”,艾丽西卡 · 维坎德,也正是影片中智能机器人 “ 艾娃 ” 的扮演者 。 
“艾娃”是纳森给“她”取的名字,为制造出能独立思考的人工智能,纳森利用自家搜索引擎“蓝皮书”的算法来构建艾娃大脑的“思维”,使之学会人类思考方式 。 
无独有偶,想让机器有人类思维,同样见之于特斯拉打造的自动驾驶AI上 。2019特斯拉自动驾驶日上,安德鲁·卡帕西 (Andrej Karpathy,特斯拉AI总负责人) 曾明确地向大众传达特斯拉自动驾驶是在模仿人类驾驶,因为现行的交通系统是基于人类视觉和认知系统来设计的 。
由此,特斯拉开发出“人工神经网络”,并利用大量有效的行车数据来训练它,在这一过程中不断完善并迭代视觉算法,终于在今年年中拿掉毫米波雷达,而随着超算Dojo浮出水面,长期被诟病只能算辅助驾驶的特斯拉,离真正的自动驾驶又近一步 。 
从学会开车,到比人类更懂开车、开得更好,当一名优秀的“老司机”,是特斯拉自动驾驶持续优化的底层逻辑 。
01 “云端司机”的神经网络【投稿|特斯拉自动驾驶的底层逻辑】纯视觉自动驾驶方案是特斯拉的独门绝技,但需建立对计算机视觉深度训练之上 。 
计算机视觉是一种研究机器如何“看”的科学,当人类看到一张图片时,能清晰辨析图片里的事物,比如说美丽的风景照、或者一张小狗的照片,然而计算机看到的却是像素 (pixel),像素是指由图像的小方格组成的,这些小方块都有一个明确的位置和相对应的色彩数值,计算机“记住”的就是这堆数字字符,而不是具体事物 。 
如果想让计算机能像人类一样快速准确识别出图片里的事物,机器也有了人工大脑,来模拟人脑处理加工图像信息过程,分为输入层、隐藏层、输出层,里面有许多人工神经元,可视作人脑初级视觉皮层中的锥体细胞和中间神经元 。 
整个训练过程亦可类比小孩看图识物,通过一次次输入、对比、纠正,完成机器图像认知 。通常在训练初期,人工神经网络识别结果的准确度非常低,输出结果和实际值相似度可能只有10%;为了提高准确度,需要再将两者误差从输出层反向传播至输入层,并在反向传播中,修正神经网络隐藏层的参数值,经过上百万次的训练,误差逐渐将收敛,直至输入和输出端匹配度达到99% 。 
投稿|特斯拉自动驾驶的底层逻辑

推荐阅读