投稿|特斯拉自动驾驶的底层逻辑投稿|特斯拉|自动驾驶新浪潮

文章图片

图片来源@视觉中国

文 | 锦缎

如果机器人有大脑，会是什么样？
在科幻电影《机械姬》里，全球最大搜索引擎公司“蓝皮书”CEO纳森向观众展示了自己发明的机器人大脑，并留下这么一句话：“人们认为搜索引擎是人们思考的事物，但其实那是人们思考的方式。”

文章图片

该影片上映于 2015 年，被誉为人工智能爱好者必看的电影之一，拿下包括奥斯卡金像奖在内等多项国际电影大奖。但在众多奖项中，单项之冠是 “ 最佳女配角 ”，艾丽西卡 · 维坎德，也正是影片中智能机器人 “ 艾娃 ” 的扮演者。
“艾娃”是纳森给“她”取的名字，为制造出能独立思考的人工智能，纳森利用自家搜索引擎“蓝皮书”的算法来构建艾娃大脑的“思维”，使之学会人类思考方式。
无独有偶，想让机器有人类思维，同样见之于特斯拉打造的自动驾驶AI上。2019特斯拉自动驾驶日上，安德鲁·卡帕西（Andrej Karpathy，特斯拉AI总负责人）曾明确地向大众传达特斯拉自动驾驶是在模仿人类驾驶，因为现行的交通系统是基于人类视觉和认知系统来设计的。
由此，特斯拉开发出“人工神经网络”，并利用大量有效的行车数据来训练它，在这一过程中不断完善并迭代视觉算法，终于在今年年中拿掉毫米波雷达，而随着超算Dojo浮出水面，长期被诟病只能算辅助驾驶的特斯拉，离真正的自动驾驶又近一步。
从学会开车，到比人类更懂开车、开得更好，当一名优秀的“老司机”，是特斯拉自动驾驶持续优化的底层逻辑。
01 “云端司机”的神经网络【投稿|特斯拉自动驾驶的底层逻辑】纯视觉自动驾驶方案是特斯拉的独门绝技，但需建立对计算机视觉深度训练之上。
计算机视觉是一种研究机器如何“看”的科学，当人类看到一张图片时，能清晰辨析图片里的事物，比如说美丽的风景照、或者一张小狗的照片，然而计算机看到的却是像素（pixel），像素是指由图像的小方格组成的，这些小方块都有一个明确的位置和相对应的色彩数值，计算机“记住”的就是这堆数字字符，而不是具体事物。
如果想让计算机能像人类一样快速准确识别出图片里的事物，机器也有了人工大脑，来模拟人脑处理加工图像信息过程，分为输入层、隐藏层、输出层，里面有许多人工神经元，可视作人脑初级视觉皮层中的锥体细胞和中间神经元。
整个训练过程亦可类比小孩看图识物，通过一次次输入、对比、纠正，完成机器图像认知。通常在训练初期，人工神经网络识别结果的准确度非常低，输出结果和实际值相似度可能只有10%；为了提高准确度，需要再将两者误差从输出层反向传播至输入层，并在反向传播中，修正神经网络隐藏层的参数值，经过上百万次的训练，误差逐渐将收敛，直至输入和输出端匹配度达到99% 。