Siri跌倒,苹果吃饱

编辑导语:在苹果总的产品序列中,Siri的发展似乎不那么“顺利”;而透视Siri的整体发展历程,我们应该看到的,是智能语音交互当下的发展现状,及未来的迭代方向。本文作者针对Siri的发展,以及智能语音交互的未来做了解读,一起来看一下。
Siri跌倒,苹果吃饱
文章插图
苹果吃饱,Siri跌倒,这是不争的事实。
自2011年在iPhone 4S上惊艳亮相,Siri就成了苹果的又一符号。毕竟,在那个人工智能刚刚进入深度学习的年代,不是每一个普通人都有机会与机器智能主体对话,相比于一款新功能,Siri更像一个未来文明的使者,让AI的概念得以具象。
但随着新鲜感褪去,很多问题开始接连浮出水面:开放对话环境中答非所问,对使用者的口音语调设置门槛,仅能完成iOS生态内app的唤醒,十几年来功能迭代缓慢,智能、语音、助手,定位打出的三个层次,无论是拆开还是组合,Siri都没有达成使命。
作为苹果的产品序列,它就像个异类,如同私生子一般,只有创新的色彩,却失去了品牌下其他产品共有的实用基因。也正因如此,在苹果连年增长的同时,人们对Siri的热情渐渐黯淡,以至于悄悄关掉了“Hey Siri”的选项,不再唤醒。难道说,Siri的命运,仅仅是一个满足猎奇的新欢?
问题的答案,可以用数学中的三个点来寻找。
一、零点“零点不是点。”
这是数学中最常听到的概念。作为函数图像与轴的交点,零点更多强调了一种重合的状态,而非数量上的增减。如果把苹果的业务布局看成一条函数图像,那么Siri就是其中的零点:它是电子产品与高层次机器智能的交点,代表了向上探索的状态,却不具备庞大的体量。
在被苹果收购前,Siri就已经独立发展了2年,背靠官方科研项目,以第三方app的身份出现在苹果应用市场。看中了语音助手背后的广阔前景,乔布斯以2亿美元的价格拿下了Siri公司,由此,苹果有了自己的AI。
乔布斯对Siri的欣赏显而易见。遗憾的是,发布后第二天,乔布斯病逝。在接下来频繁的人员变动中,没有坚决果断的引领者出现,Siri开始迷失了自己的方向。投入不足、定位不清、系统封闭,让Siri的下坡路成为必然。
坦白来说,Siri在发布时就算不上成功。推出是草率的,初代功能十分局限。当时的Siri只能响应设置闹钟、打开app等简单的操作指令;而面对发送短信、拨打电话、信息检索等涵盖更多语言元素、更为灵活的语音指令,却存在明显的识别漏洞。
从人工智能深度学习的特性来看,这一问题并不难解决,只需要加大训练量就可以逐渐优化。问题在于,Siri并不是苹果的全部,与之同期进行的项目太多,既有地图、iBook等应用,又有iPad Air、iPad Pro、Apple Watch等新产品线。资源被分割,让本就没有多少经验可供参考的Siri举步维艰,“进化”被一推再推;再加上项目负责人威廉姆森的一意孤行,本该持续更新的Siri只能跟随iOS系统一年一更,使得进步的空间进一步压缩。
除了投入不够,定位不清也是一大问题。按照Siri创始人的假设,语音助手应当是“执行引擎”(do engine),而非简单的“搜索引擎”。这就意味着Siri要像一个生活中的朋友,不仅能够响应程式化的指令,还要具备应对开放性对话场景的能力,前者对应自然语言处理(NLP),后者对应了更高难度的自然语言理解(NLU)。
然而,苹果内部支持Siri的高管因为内斗相继离职、原始技术团队出走,让“最初的梦想”被涂抹了底色。搜索的功能被放大。除了简单的日常用语外,大部分语句都会被转化为搜索指令,哪怕文本中包含了“Apple”“Siri”“you”等指向性很强的词语,它也无法识别到用户的对话请求,依然会跳转到web search界面。

推荐阅读