中国科学技术大学张结--中文主页-- 分布式麦克风阵列语音信号处理

张结 ( 副教授 )
的个人主页 http://faculty.ustc.edu.cn/jzhang6/zh_CN/index.htm
副教授

研究方向当前位置：中文主页 >>研究方向

分布式麦克风阵列语音信号处理

背景简介：传统麦克风阵列的固定阵型结构是导致其拾音质量不佳的主要原因。特别是在远场交互条件下，拾音质量随着目标说话人与阵列的距离增大而降低；以及多人混说条件下，说话人身份混淆也给前端语音增强增加了难度。如何突破传统麦克风阵列的阵型约束，提升目标说话人的拾音质量，满足真实场景下语音交互需求，成为当前音频和语音信号处理领域的一个热点和挑战性研究课题。随着智能终端（如智能手机/平板、智能电视、音箱）的兴起，分布式麦克风阵列逐渐受到国内外学术界和产业界的广泛关注。分布式麦克风阵列相对传统麦克风阵列具有多方面优势，有望大幅提升真实场景中拾音质量：首先，拓展性更强，分布式阵型可以避免对某个设备的过度依赖，新设备也可就近接入系统；其次，拾音范围更广，麦克风的随机分布直接避开了远场条件，使得全空间均匀式拾音成为可能；再次，信息融合方式更加灵活，比如为小尺寸终端共享其他设备音频数据可以大大提升其声信号感知性能。作为下一代声信号采集和处理平台，分布式麦克风阵列在腾讯inside智能会议、讯飞MORFEI智能家居等音频解决方案中已有初步应用。

研究任务：

1）麦克风效用度量，即衡量每个麦克风设备的拾音可靠性；

2）麦克风设备信号同步，即消除设备间采样率和时钟偏差的影响；

3）麦克风阵型优化，包括主拾音设备唤醒、最优拾音阵列规划、调度，以及基于阵列优化的语音增强；

4）多设备协同式语音增强，即分布式语音增强；

5）麦克风聚类，即为多个语音感知任务分别规划相应最优子阵列，如语音增强、说话人识别、声源定位等。

6）面向任意阵列的通用语音增强，适用于单设备、多设备等任意阵型拓扑结构，以及适用于不同类型复杂噪声。

麦克风阵列.png