Siri属于语音识别还是人工智能?


Siri是一个语音聊天机器人或者语音查询引擎 。它们的核心都是这样的:
听:在听到关键词或感应按钮按下之后 。设备开始记录您的声音的波形 。通常直到您停止说出足够长的时间并认为您已停止 。然后它使用语音到文本(STT)引擎将您的语音波形(或已经传输到服务器)发送到服务器 。这可以是一个神经网络或其他计算引擎 。将你的声音的波形转换为一串文本 。
思考:在这个阶段 。言语聊天机器人使用自然语言处理(NLP)将文本转换为计算机可以理解的内容 。通常是一个命令和一组参数 。如DOS或Linux命令行 。
【Siri属于语音识别还是人工智能?】查找数据 :根据你的指令发送到数据库 。例如Expedia或Travelocity 。它返回符合搜索条件的酒店列表 。这些可以通过HTML格式返回 。包括手机上的图片和链接 。并以图形方式显示 。你的chatbot也可以口头回复 。
说话 :现在聊天机器人可能会获得最佳结果 。并将其中的信息编成文本字符串 。例如:“我发现的最重要结果是位于圣何塞2050 Gateway Place的机场附近的San Jose Doubletree 。它在Expedia上获得4颗星 。你想预订吗?“
然后通过语音到文本(STT)合成器将此文本字符串转换为语音片段 。并将该片段发回给您 。以便在设备或计算机上播放 。
尽管这是一系列令人印象深刻的处理步骤 。经常使用大量深度学习训练系统 。并且它的处理密集程度很高 。但大部分仍然需要在服务器上运行 。但我不会称它为AI没有表现出任何真正的认知 。深刻的问题解决 。也没有真正的对话能力 。
顺便说一句 。如果你想知道更多硅谷或者美国科技的前沿信息 。可以关注微信号“硅发布” 。
其他观点:
语音识别属于人工智能 。siri属于人工智能的一个产品 。开发技术包括语音识别在内的很多人工智能技术 。谢谢!

    推荐阅读