语音特征信息提取方法、终端及可读存储介质技术

技术编号：23402039 阅读：20 留言：0更新日期：2020-02-22 14:06

本申请公开了一种语音特征信息提取方法、终端和计算机可读存储介质，通过获取发言人目标语音数据，得到目标语音片段；获取发言人基准语音数据；比对各所述目标语音片段和所述基准语音数据，获得比对结果；基于所述比对结果，生成并提取各所述目标语音片段中的发言人语音特征信息，实现语音特征信息的提取，由此可以在多个发言人情境下，将所有发言人的语音特征信息区分并提取出来。

Speech feature information extraction method, terminal and readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
语音特征信息提取方法、终端及可读存储介质
本申请涉及语音信号处理
，尤其涉及一种语音特征信息提取方法、终端及可读存储介质。
技术介绍
目前，在多个说话人场景中，通常会出现不同说话人语音混叠的情况，目前针对混合语音中目标说话人的语音提取研究越来越受到重视。语音提取方法主要为层次聚类和谱聚类等，如层次聚类有：提取语音段的梅尔倒谱系数(MFCC)特征，之后训练部分使用贝叶斯信息准则(BIC)对初始类进行处理，获得较纯的初始类别，之后采用聚类算法对于MFCC特征进行聚类，并对每一类训练获得GMM模型特征，在识别阶段，使用基于GMM模型的说话人识别进行说话人判断；然而层次聚类在进行无监督的说话人聚类识别时，以最小类间距是否大于一定的阈值作为判定聚类结束的标准，阈值的确定限制了层次聚类算法的效果。由此可见，目前语音特征信息提取方法自适应能力低。
技术实现思路
本申请的主要目的在于提供一种语音特征信息提取方法、终端及计算机存储介质，旨在解决现有技术中多个发言人信息提取精度低的技术问题。为实现上述目的，本申请实施例提供一种语音特征信息提取方法，所述语音特征信息提取方法包括以下步骤：获取发言人目标语音数据，得到目标语音片段；获取发言人基准语音数据；比对各所述目标语音片段和所述基准语音数据，获得比对结果；基于所述比对结果，生成并提取各所述目标语音片段中的发言人语音特征信息。可选地，所述获取发言人目标语音数据的步骤包括：接收待提取的各所述发言人的原始语音数据...

【技术保护点】
1.一种发言人语音特征信息提取方法，其特征在于，所述发言人语音特征信息提取方法包括：/n获取发言人目标语音数据，得到目标语音片段；/n获取发言人基准语音数据；/n比对各所述目标语音片段和所述基准语音数据，获得比对结果；/n基于所述比对结果，生成并提取各所述目标语音片段中的发言人语音特征信息。/n

【技术特征摘要】
1.一种发言人语音特征信息提取方法，其特征在于，所述发言人语音特征信息提取方法包括：
获取发言人目标语音数据，得到目标语音片段；
获取发言人基准语音数据；
比对各所述目标语音片段和所述基准语音数据，获得比对结果；
基于所述比对结果，生成并提取各所述目标语音片段中的发言人语音特征信息。

2.如权利要求1所述的语音特征信息提取方法，其特征在于，所述获取发言人目标语音数据的步骤包括：
接收待提取的各所述发言人的原始语音数据；
对所述原始语音数据进行信号预处理，得到各所述发言人的目标语音数据。

3.如权利要求2所述的语音特征信息提取方法，其特征在于，所述得到目标语音片段的步骤包括：
基于预设关键字和预设语气词，对所述目标语音数据进行语义识别，获得识别结果；
基于所述识别结果，获得所述目标语音片段。

4.如权利要求2所述的语音特征信息提取方法，其特征在于，所述对所述原始语音数据进行信号预处理，得到各所述发言人的目标语音数据的步骤包括：
检测所述语音数据，根据声音频率区分出所述语音数据中的噪声；
对所述语音数据进行去除噪声处理，得到各所述发言人的目标语音数据。

5.如权利要求1所述的语音特征信息提取方法，其特征在于，所述获取发言人基准语音数据的步骤包括：
通过声纹识别，获取所述发言人个数；
基于所述发言人个数，输出语音录制通知，其中，所述通知为要求各所述发言人按照预设语音录制模型进行语音录制；
接收各所述发言人...

【专利技术属性】
技术研发人员：陈昊亮，许敏强，杨世清，
申请(专利权)人：广州国音智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人