命令|看下巴就够？识别无声语言的项链来了

想象一下，如果你坐在落针可闻的会议室或图书馆，脱口而出「Siri，看看明天的天气」，这或许并不合适。
当一个人说不了话或者必须保持安静，却需要给智能设备指令，这该怎么办？
为此，康奈尔大学的信息科学助理教授 Cheng Zhang 和博士生 Ruidong Zhang，设计了一款叫做「Speechin」的项链。

文章插图
▲ 图片来自：Cornell University
它基于下巴运动，捕捉「颈部和面部皮肤变形图像」，从而识别无声语言，目前可以识别英语和中文的简单短语。

文章插图
【命令|看下巴就够？识别无声语言的项链来了】SpeeChin 的红外摄像头安装在 3D 打印的「项链盒」上，「项链盒」挂在银链上，摄像头指向佩戴者的下巴。为了提高稳定性，开发人员在两侧设计了「机翼」，并在底部放置了一枚硬币。
除了这些，SpeeChin 还配备有微处理器、电池和蓝牙模块。

文章插图
▲ 图片来自：Cornell University
利用基于机器学习的算法，该设备能根据佩戴者的下巴运动，确定佩戴者在无声地说出哪些命令，然后将这些命令中继到配对的智能手机，就像另一种沟通方式下的 Siri。
为了避免隐私问题，SpeeChin 只会怼向下巴下方，不会直接指向用户的脸。
在最初的试验中，有 20 名参与者（10 名说英语，10 名普通话），研究人员测量了他们下巴的基线位置，然后使用差分图像训练 SpeeChin 识别简单命令。
10 位英语参与者默默说出 54 条命令，包括数字、交互命令、语音助手命令、标点命令和导航命令，其他 10 位普通话参与者的 44 条命令也是如此。

文章插图
▲ 动图制作自：YouTube@Cornell University
事实证明，SpeeChin 识别英语和普通话命令的平均准确率分别为 90.5% 和 91.6%。研究人员表示，这款设备有可能学习一个人的无声语音模式。
研究人员还要求 6 名参与者在行走时默默说出 10 个普通话和 10 个英语短语。这项研究的成功率较低，主要是因为参与者的头部以不可预测的方式移动。
为什么要以项链的形式做无声语音识别这件事？一位研究人员阐述了他们的研究目的：
我们认为项链是人们习惯的一种形式，而不是耳挂式设备，后者可能不太舒服；至于无声语音，人们可能会想「我的手机上已经有语音识别设备了」。但是你需要为一些无法发声的人和场合发声。
值得一提的是，SpeeChin 在外观上与 NeckFace 相似。NeckFace 是 Cheng Zhang 和他的 SciFi Lab 团队去年推出的设备，通过使用红外摄像机，在颈部下方捕捉下巴和面部的图像，并生成完整表情的 3D 重建，从而持续跟踪面部表情。

文章插图
▲ 动图制作自：YouTube@CornellScifiLab
NeckFace 在心理健康领域可能特别有用，因为它可以跟踪人们一天中的情绪。虽然人们并不总是把情绪表现在脸上，但随着时间的推移，面部表情的变化量可能表明情绪波动。
NeckFace 也可以用于其他场景，比如在无法选择前置摄像头时进行虚拟会议、虚拟现实场景中的面部表情检测等等。
如果 SpeeChin 进一步发展，它的使用场景同样会越来越多，包括必须静音的环境、无法识别的嘈杂环境以及缺乏语言能力的人群。

命令|看下巴就够？识别无声语言的项链来了

推荐阅读

夏至是不是白天最长的一天夏至是白天最长的一天吗

初中班级管理制度（中学生班级管理规章制度

cpu|外媒续航实测：iPhone13 Pro Max进步显著，安卓这款机型表现最好

我的空调制冷到25度制冷不正常怎么办松下空调25度以上制冷不启动

艾草鲜的好还是陈的好

现在这个版本的地下城与勇士白金徽章,激光炮、无双波、流心狂这三个值不值钱？

苹果手机怎么修改输入法，iphone怎么改输入法

耳鸣不一定是脑供血不足引起的脑供血不足会引起耳鸣吗

家里放什么花好家里放什么花好运

君子欺之以方什么意思君子欺之以方的意思是什么

茶叶的命名以什么为依据

? 美的电火锅的价格怎么样详扒内容为你答疑

骐达变速箱油怎么换更好骐达变速箱油怎么换

电动幕布什么牌子性价比高？推荐几款质量好的电动幕布

二哈怎么看纯不纯图解如何辨别纯种哈士奇，血统哈士奇和普通哈士奇对比

《海贼王》11位超新星实力排名大洗牌,网传索隆被官方确认连升8名挤进前三,你怎么看？

干燥综合征的干眼病和我们常说的干眼病是一回事吗？

手撕凤梨怎么撕

高通|摄像头设计是美还是丑？三星S22超大杯曝光，或首批搭载骁龙898

小吃店什么最赚钱小县城开披萨店怎么样