专利详情

专利名称	基于非监督学习的噪声谱估计与语音活动度检测方法
申请号	CN201010178166.4	专利类型	发明专利
公开（公告）号	CN101853661A	公开（授权）日	2010.10.06
申请（专利权）人	中国科学院声学研究所	发明（设计）人	应冬文;颜永红;付强;潘接林
主分类号	G10L19/00(2006.01)I	IPC主分类号	G10L19/00(2006.01)I;G10L21/02(2006.01)I
专利有效期	基于非监督学习的噪声谱估计与语音活动度检测方法至基于非监督学习的噪声谱估计与语音活动度检测方法	法律状态	实质审查的生效
说明书摘要	本发明涉及一种基于非监督学习的噪声功率谱估计与语音活动度检测方法，包括下列步骤：1)对于语音信号在每一个频点上的对数幅度特征，建立一个GMM模型；2)对于一段语音数据，设定M帧缓存，把前M帧输入信号存入缓存中，提取缓存中M帧的对数幅度谱，代入步骤1)的GMM模型进行初始化，得到初始化的模型λ0，k；3)在得到初始化的模型λ0，k之后，从第M+1帧开始，采用增量学习的方法，逐帧更新GMM模型，依次递推得到并得出噪声值和语音信号在第i帧的第k个频点上的出现概率。本发明是谱估计与语音活动度检测的紧耦合解决方案，能够增强语音应用系统对噪声环境的适应性；本发明不依赖于“噪声起始”假设，并且，本发明还能够提供语音活动度在时频二维空间上的描述。