语音处理方法、计算机可读存储介质、计算机程序和电子设备技术

技术编号：24462208 阅读：18 留言：0更新日期：2020-06-10 17:21

本发明专利技术实施例提供一种语音处理方法、计算机可读存储介质、计算机程序和电子设备。语音处理方法包括：获取包含身份标识数据说话人的语音数据；对语音数据进行语音识别以及语义分析，至少获得识别标识数据；对所识别标识数据进行扩展处理，获得说话人的扩展标识数据；将扩展标识数据与用户信息数据库中存有的用户身份标识数据进行标识匹配，获得匹配的数据记录；对语音数据进行特征提取，获取说话人的特征数据；将特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配，确定说话人的身份以及身份认证结果。由此，在进行身份认证时可控地扩大搜索范围，同时提高命中率。

Speech processing method, computer readable storage medium, computer program and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、计算机可读存储介质、计算机程序和电子设备
本专利技术实施例涉及信息处理技术，尤其涉及一种语音处理方法、计算机可读存储介质、计算机程序和电子设备。
技术介绍
身份认证技术是在计算机网络中确认操作者身份的过程而产生的有效解决方法。对用户的身份认证基本方法分为三种，即基于信息密码的身份认证、基于信任物体的身份认证、基于生物特征的身份认证。其中，基于生物特征的身份认证是根据独一无二的身体特征来证明操作者身份，比如指纹、人脸等。说话人识别是生物特征识别技术的一种，其理论基础是，每一个声音都具有独特的特征，通过该特征能将不同人的声音进行有效的区分。说话人识别技术通常用于说话人辨认和说话人确认等两种场景。在当前的生物特征识别中，说话人身份确认技术仅成熟于1:1和小规模的情况下；人脸的辨认应用也仅取相似度前几位的候选，而指纹识别、人脸识别技术目前也仅成熟于1:1的场景下，同时还面临这各种各样的隐私及假冒的问题。在现有的说话人识别技术中对于说话人身份的辨认，由于集合大，导致识别速度慢、准确率低。
技术实现思路
本专利技术实施例的目的在于，提供一种语音处理方案，以使得能够在对海量用户集合进行说话人辨认中提高命中率。根据本专利技术实施例的第一方面，提供一种语音处理方法，包括：获取说话人的语音数据，所述语音数据包含所述说话人的身份标识数据；对所述语音数据进行语音识别，获得相应的识别文本数据；对所述识别文本数据进行语义分析，至少获得识别标识数据；对所述识别标识数据进行扩展处理，获得所述...

【技术保护点】
1.一种语音处理方法，包括：/n获取说话人的语音数据，所述语音数据包含所述说话人的身份标识数据；/n对所述语音数据进行语音识别，获得相应的识别文本数据；/n对所述识别文本数据进行语义分析，至少获得识别标识数据；/n对所述识别标识数据进行扩展处理，获得所述说话人的扩展标识数据；/n将扩展标识数据与用户信息数据库中存有的用户身份标识数据进行标识匹配，获得匹配的数据记录，所述数据记录至少包括所述用户身份标识数据和用户身份特征数据；/n对所述语音数据进行特征提取，获取所述说话人的特征数据；/n将所述特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配，确定所述说话人的身份以及身份认证结果。/n

【技术特征摘要】
1.一种语音处理方法，包括：
获取说话人的语音数据，所述语音数据包含所述说话人的身份标识数据；
对所述语音数据进行语音识别，获得相应的识别文本数据；
对所述识别文本数据进行语义分析，至少获得识别标识数据；
对所述识别标识数据进行扩展处理，获得所述说话人的扩展标识数据；
将扩展标识数据与用户信息数据库中存有的用户身份标识数据进行标识匹配，获得匹配的数据记录，所述数据记录至少包括所述用户身份标识数据和用户身份特征数据；
对所述语音数据进行特征提取，获取所述说话人的特征数据；
将所述特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配，确定所述说话人的身份以及身份认证结果。

2.根据权利要求1所述的方法，其特征在于，所述对所述识别标识数据进行扩展处理，获得所述说话人的扩展标识数据，包括：
将所述识别标识数据的字符串中的字符替换为容易与所述字符混淆的替换字符，获得所述扩展标识数据；和/或，
将所述识别标识数据的字符串中处于端侧的字符删除，获得所述扩展标识数据。

3.根据权利要求1或2所述的方法，其特征在于，在对所述识别标识数据进行扩展处理，获得扩展标识数据之前，所述方法还包括：
将所述识别标识数据与用户信息数据库中存有的用户身份标识数据进行标识匹配，获得匹配的数据记录；
如果没有匹配得到数据记录，则执行对所述识别标识数据进行扩展处理，获得扩展标识数据的步骤；
如果匹配得到数据记录，则执行对所述语音数据进行特征提取以及将所述特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配的处理。

4.根据权利要求1或2所...

【专利技术属性】
技术研发人员：郑方，邬晓钧，向银杉，张慧，方亚南，
申请(专利权)人：北京得意音通技术有限责任公司，贵州得意音通技术有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人