无声言语识别项链不出声也能命令Siri！清华校友开发

2024-11-15

这，或许是如今跟Siri交流最潮的模式了——

只要要 动动嘴皮子 ，就能让它under你的control。

没错，就是 不须要出任何声响 的那种。

这就是来自康奈尔华人团队的最新钻研成绩，无声语音识别。

在没有声响的状况下，你能猜进去他在说什么吗？

但在SpeeChin的加持下，如今的Siri、Alexa等就曾经可以识别，而且还允许普通话和英文！

是有种“此时无声胜似有声”的觉得了。

康奈尔团队研发的SpeeChin，其实是一条神奇的项链。

戴上这条项链，就能开启无声语音控制的大门了。

例如对着电脑默念一句，音乐就会智能切换成下一首歌：

或许你会说一个单词过于繁难了，别急，如今就来放大难度：

“Switch to Taylor Swift.”

可见，SpeeChin即使是面对一句完整的话术，也可以做到精准识别。

而这条“无声识别”项链的关键，就在于装置在项链下方的 红外摄像机 。

它可以捕捉到人物颈部和面部皮肤的变形图像，从而启动剖析识别上班，确定从“嘴皮子”传播的是什么命令。

而且这条项链不只能无声识别英文，连中文

在最后的试验中，有20人介入到了测试中，其中10人讲英文，另外10人说普通话。

钻研人员让测试者区分用英文和中文收回数十条指令，包括数字、互动指令、语音辅佐指令、标点指令和导航指令。

最后的试验结果，“无声识别”的准确率区分到达了和。

这项钻研来自康奈尔大学，一作是Ruidong Zhang。

其中，Cheng Zhang是这项钻研的通信作者。

他是康奈尔大学信息迷信系的助理传授，他的钻研聚焦在如何失掉人体及其周围的信息，以应答各种运行畛域中的事实环球应战，如交互、肥壮感知和优惠识别。

钻研的一作Ruidong Zhang，他是Cheng Zhang传授的一名博士生，本科毕业于清华大学。

他的钻研兴味在于人机交互和普适计算，特意是建设新型的可穿戴设施，用来促成互动体验并加深咱们对人类行为的了解。

至于为什么他们要做SpeeChin这项上班，据Ruidong Zhang解释：

最后，来揭晓一下扫尾GIF的答案：

你猜对了吗？

技术 AI 语音识别

无声言语识别 项链 不出声也能命令Siri！清华校友开发