支持语音激活的智能管家
Posted 10/12/2016 by 敏芯微电子技术有限公司市场部经理,Weston Xu
对于很多消费者而言,智能音箱是智能家庭管理的入口设备。用户使用这些小巧的设备控制音乐播放、快速在线订购一些基本消费品以及通过强大的互联网解决迫在眉睫的问题。一些大厂商已经进入了这个市场,包括亚马逊、谷歌、罗技和京东,而更多厂商也蓄势待发。
现在,大多数智能音箱的主要用途包括以下三种:智能家庭中心、家庭购物入口以及大数据获取。为了支持这三种用途,任何智能音箱的核心功能必然是优秀的语音识别,这不仅需要一个麦克风阵列,还需要集成的硬件以及软件算法来接收和处理语音信息。为了确保不遗漏任何一条语音指令,需要环绕着设备部署麦克风阵列(通常由7个到8个麦克风组成)。举个例子,亚马逊的Echo智能音箱使用7个麦克风组成的阵列。
市场上的大多数解决方案使用PDM MEMS麦克风阵列+微处理器或模拟MEMS麦克风阵列+音频ADC+微处理器的配置。为了处理接收到的信号,每组麦克风信号都要经过4个双通道音频模数转换器(ADC)中的一个。在每个ADC中,音频信号被转换为I2S/PCM格式并传输到应用微处理器,后者仅有数量有限的I2S/PCM接口。如果这个系统处于高负荷状态的话,响应时间就没有那么快了,因为4个ADC要用来为整个麦克风阵列处理所有的音频转换任务。
敏芯通过将一个音频ADC直接集成到麦克风一举解决了这个问题。这个数字麦克风能够在内部将模拟信号转换为I2S音频流,无需外部ADC芯片。由这种麦克风组成的阵列可直接连接到微处理器,或者是按需与莱迪思的iCE40系列FPGA相结合,能够大幅缩减物料表(BOM)并降低成本,而且不用采用多个外部ADC。
敏芯还成功地降低了设备功耗,因为只有数字麦克风及其连接的应用处理器需要保持工作状态来侦测声音。这对于移动市场来说是很重要的一个优点,因为虽然目前市场上语音识别功能已经很普及了(Siri、Cortana和Google),但还是需要通过按钮、手势、动作或是其他方式激活设备开始聆听。功耗的降低能够实现更加稳定的语音识别,对于电池供电的移动设备来说可以保持功能处于一直开启的状态。
未来,随着人工智能(AI)系统的发展,消费者将使用更加自然的语言和设备进行交流,语音识别将变得更加重要。届时,作为数字世界的入口设备,智能音箱和智能手机将变得更加强大,具备更多的功能