Workshop | 语音识别设计IOT工作坊预约报名-郑州创客空间活动-活动行

活动内容收起 展开

ZHENGZHOU MAKERSPACE

WORKSHOP

语音识别，Voice Recongnition。作为人机交互中语音交互的一个重要的技术手段，并且在语音交互中处于核心位置，也就是自从有了计算机，甚至更早的时候我们都想要让除了我们人类之外的任何物品能够听懂我们讲话。只有听懂之后才能有接下来的反应，而这种反应可以是通过语言表达出来，也可以是像一个内敛的孩子那样优秀虽不善言辞但默默的去做了。前者虽属于语音交互中的另一项技术--语音合成，但并非必需。

▲常见的语音助手

而想要外部环境也懂得我们的需求，换句话来讲就是让我们的生活变得更加方便。现在一种呼之欲出甚至已经在应用的技术--物联网（Internet Of Thing）似乎能够解决这样的问题，因为我们已经深刻感受到了互联网给我们生活带来的极大便利了，而互联网仅仅是电脑，手机这两个设备而已。如果万物互联，其威力可以想见。关于IOT的介绍互联网上有好多资料，这里就不再赘述了。

▲小米布局的物联网生态链

如果想要万物互联，互联之后带来生活的方便，那么键盘鼠标来控制都是不能考虑的，甚至触摸也不行，因为不可能到处都是电容屏。也就只剩下语音了吧。因为语言是人类等生命之间最流畅最方便的交流方式，那么语音是否也是跟外部世界进行沟通的最自然的交互方式呢？就目前来看的确是的。

回想一下窝在沙发上看国剧，当本能地说一句『小爱同学，关闭客厅的灯』要比伸手去找遥控器（或者遥控器替代品）要省时省力，耗能少。不同的任务，有不同的最佳交互路径，例如对于复杂的长时间输入（例如写word，或是coding，TNT就是血淋淋的例子），目前的软件仍然需要键盘的支持。对于多轮次复杂逻辑的交互，由于视觉的反馈很快，触控也具有一定优势（例如重设一部手机，或是在App上买机票）。但如果是单轮轻度输入，语音的优势就会很明显（例如，让小爱/Siri帮忙设置早上7点的闹钟，绝对是Killer App）。更有趣的是，在这个场景下语音将复杂的输入设置（早晨，7点，每天重复，确认）合并了，一气呵成，妙不可言。

工坊简介：

本次工坊在介绍语音识别技术原理的基础上，自己动手亲自设计一个能够听懂我们讲话的智能系统，语音识别背后的技术原理我们这里不再细究，我们只是从应用的层面来设计一个能够听懂我们讲话的机器人，而该机器人的外形和功能可以是切实的功能型机器人比如瓦力，机械臂等，也可以是一个应用场景像在家里或者车里。而反馈响应方式既可以有语音回应，也可以只是执行对应的动作。