智能语音|Siri跌倒,苹果吃饱

智能语音|Siri跌倒,苹果吃饱
文章图片

文丨新眸,作者丨刘思璇,编辑丨桑明强
苹果吃饱,Siri跌倒,这是不争的事实 。
自2011年在iPhone 4S上惊艳亮相,Siri就成了苹果的又一符号 。毕竟,在那个人工智能刚刚进入深度学习的年代,不是每一个普通人都有机会与机器智能主体对话,相比于一款新功能,Siri更像一个未来文明的使者,让AI的概念得以具象 。
但随着新鲜感褪去,很多问题开始接连浮出水面:开放对话环境中答非所问,对使用者的口音语调设置门槛,仅能完成iOS生态内app的唤醒,十几年来功能迭代缓慢,智能、语音、助手,定位打出的三个层次,无论是拆开还是组合,Siri都没有达成使命 。
作为苹果的产品序列,它就像个异类,如同私生子一般,只有创新的色彩,却失去了品牌下其他产品共有的实用基因 。也正因如此,在苹果连年增长的同时,人们对Siri的热情渐渐黯淡,以至于悄悄关掉了“Hey Siri”的选项,不再唤醒 。难道说,Siri的命运,仅仅是一个满足猎奇的新欢?
问题的答案,可以用数学中的三个点来寻找 。
01、零点“零点不是点 。”
这是数学中最常听到的概念 。作为函数图像与轴的交点,零点更多强调了一种重合的状态,而非数量上的增减 。如果把苹果的业务布局看成一条函数图像,那么Siri就是其中的零点:它是电子产品与高层次机器智能的交点,代表了向上探索的状态,却不具备庞大的体量 。
在被苹果收购前,Siri就已经独立发展了2年,背靠官方科研项目,以第三方app的身份出现在苹果应用市场 。看中了语音助手背后的广阔前景,乔布斯以2亿美元的价格拿下了Siri公司,由此,苹果有了自己的AI 。
乔布斯对Siri的欣赏显而易见 。遗憾的是,发布后第二天,乔布斯病逝 。在接下来频繁的人员变动中,没有坚决果断的引领者出现,Siri开始迷失了自己的方向 。投入不足、定位不清、系统封闭,让Siri的下坡路成为必然 。
坦白来说,Siri在发布时就算不上成功 。推出是草率的,初代功能十分局限 。当时的Siri只能响应设置闹钟、打开app等简单的操作指令;而面对发送短信、拨打电话、信息检索等涵盖更多语言元素、更为灵活的语音指令,却存在明显的识别漏洞 。
从人工智能深度学习的特性来看,这一问题并不难解决,只需要加大训练量就可以逐渐优化 。问题在于,Siri并不是苹果的全部,与之同期进行的项目太多,既有地图、iBook等应用,又有iPad Air、iPad Pro、Apple Watch等新产品线 。资源被分割,让本就没有多少经验可供参考的Siri举步维艰,“进化”被一推再推;再加上项目负责人威廉姆森的一意孤行,本该持续更新的Siri只能跟随iOS系统一年一更,使得进步的空间进一步压缩 。
除了投入不够,定位不清也是一大问题 。按照Siri创始人的假设,语音助手应当是“执行引擎”(do engine),而非简单的“搜索引擎” 。这就意味着Siri要像一个生活中的朋友,不仅能够响应程式化的指令,还要具备应对开放性对话场景的能力,前者对应自然语言处理(NLP),后者对应了更高难度的自然语言理解(NLU) 。
然而,苹果内部支持Siri的高管因为内斗相继离职、原始技术团队出走,让“最初的梦想”被涂抹了底色 。搜索的功能被放大 。除了简单的日常用语外,大部分语句都会被转化为搜索指令,哪怕文本中包含了“Apple”“Siri”“you”等指向性很强的词语,它也无法识别到用户的对话请求,依然会跳转到web search界面 。另外,在部分用户恶意引导下出现的人群歧视、政治倾向等敏感问题,也促使了技术团队做出“一刀切”的决定,让简单的搜索成为挡箭牌 。

推荐阅读