业务语音的质检方法、装置、设备及存储介质制造方法及图纸

技术编号：28041947 阅读：36 留言：0更新日期：2021-04-09 23:25

本发明专利技术涉及人工智能领域，公开了业务语音的质检方法、装置、设备及存储介质，用于提高对业务语音进行质检的准确率和质检效率。业务语音的质检方法包括：根据业务语音数据与预置声明编码数据之间的基础相似度筛选待检测声明语音编码数据；生成待检测声明文本的多个待检测声明句向量；根据待检测声明句向量确定目标待纠错文本；对目标待纠错文本进行纠错并筛查预置关键词，若存在预置关键词，则判定业务语音数据存在声明类风险语音数据；通过意图识别算法生成业务语音数据对应的业务识别意图，若业务识别意图中存在预置风险意图，则判定业务语音数据存在语义类风险语音数据。本发明专利技术还涉及区块链技术，业务语音数据可存储于区块链中。

全部详细技术资料下载

【技术实现步骤摘要】
业务语音的质检方法、装置、设备及存储介质
本专利技术涉及人工智能中的语音语义领域，尤其涉及一种业务语音的质检方法、装置、设备及存储介质。
技术介绍
电话业务语音质检主要是用于检查电话业务人员在沟通过程中是否存在诱导、辱骂客户以及规避免责声明等现象，避免沟通过程中因不规范的语音行为导致客户投诉或法律风险。现有对电话业务语音质检的质检方式主要是对电话语音进行监听，判断监听内容中是否存在违规(风险)语音，若存在违规语音则说明该电话业务语音违规。但是在利用这种质检方式对电话业务语音进行质检时，需要进行质检的业务语音繁多冗杂，导致对业务语音进行质检的准确率以及质检效率低下。
技术实现思路
本专利技术提供了一种业务语音的质检方法、装置、设备及存储介质，用于提高对业务语音进行质检的准确率以及质检效率。本专利技术第一方面提供了一种业务语音的质检方法，包括：获取业务语音数据，并利用编码器对所述业务语音数据进行编码，得到编码语音数据，计算所述编码语音数据与预置声明编码数据之间的基础相似度，根据所述基础相似度的...

【技术保护点】
1.一种业务语音的质检方法，其特征在于，所述业务语音的质检方法包括：/n获取业务语音数据，并利用编码器对所述业务语音数据进行编码，得到编码语音数据，计算所述编码语音数据与预置声明编码数据之间的基础相似度，根据所述基础相似度的数值在所述编码语音数据中筛选待检测声明语音编码数据；/n基于语音识别算法将所述待检测声明语音编码数据转化为待检测声明文本，利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量；/n计算每个待检测声明句向量与标准声明句向量之间的基础相似概率值，将基础相似概率大于标准阈值所对应的待检测声明文本确定为目标待纠错文本；/n利用模糊匹配算法对所述目标待纠错文本进行纠错，得...

【技术特征摘要】
1.一种业务语音的质检方法，其特征在于，所述业务语音的质检方法包括：
获取业务语音数据，并利用编码器对所述业务语音数据进行编码，得到编码语音数据，计算所述编码语音数据与预置声明编码数据之间的基础相似度，根据所述基础相似度的数值在所述编码语音数据中筛选待检测声明语音编码数据；
基于语音识别算法将所述待检测声明语音编码数据转化为待检测声明文本，利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量；
计算每个待检测声明句向量与标准声明句向量之间的基础相似概率值，将基础相似概率大于标准阈值所对应的待检测声明文本确定为目标待纠错文本；
利用模糊匹配算法对所述目标待纠错文本进行纠错，得到待判定文本，在所述待判定文本中筛查预置关键词，若所述待判定文本中存在所述预置关键词，则判定所述业务语音数据存在声明类风险语音数据；
通过意图识别算法生成所述业务语音数据对应的业务识别意图，判断所述业务识别意图中是否存在预置风险意图，若所述业务识别意图中存在预置风险意图，则判定所述业务语音数据存在语义类风险语音数据。

2.根据权利要求1所述的业务语音的质检方法，其特征在于，所述获取业务语音数据，并利用编码器对所述业务语音数据进行编码，得到编码语音数据，计算所述编码语音数据与预置声明编码数据之间的基础相似度，根据所述基础相似度的数值在所述编码语音数据中筛选待检测声明语音编码数据包括：
获取业务语音数据，利用奈奎斯特采样算法对所述业务语音数据进行采样，得到业务语音波形；
对所述业务语音波形进行量化处理，得到量化语音数据，将所述量化语音数据转化为数字脉冲，生成编码语音数据；
利用相似度算法计算所述编码语音数据与预置声明编码数据之间的相似度数值，得到基础相似度；
将数值最大的基础相似度所对应的编码语音数据确定为待检测声明语音编码数据。

3.根据权利要求1所述的业务语音的质检方法，其特征在于，所述基于语音识别算法将所述待检测声明语音编码数据转化为待检测声明文本，利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量包括：
基于语音识别算法获取所述待检测声明语音编码数据对应的待检测业务语音数据，提取所述对应的待检测业务语音数据中的语音特征，根据所述语音特征匹配得到待检测声明文本；
利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量。

4.根据权利要求3所述的业务语音的质检方法，其特征在于，所述基于语音识别算法获取所述待检测声明语音编码数据对应的待检测业务语音数据，提取所述对应的待检测业务语音数据中的语音特征，根据所述语音特征匹配得到待检测声明文本包括：
基于语音识别算法获取所述待检测声明语音编码数据对应的待检测业务语音数据，提取所述对应的待检测业务语音数据中的语音特征；
将所述语音特征转化为音素信息，其中，所述音素信息用于指示构成音节的最小语音单位；
在预置字典中匹配与所述音素信息相同的文字信息，得到待检测声明文本。

5.根据权利要求3所述的业务语音的质检方法，其特征在于，所述利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量包括：
获取所述待检测声明文本的多个语句序列，在每个语句序列的初始位置添加预置标记字符，得到多个第一标记序列；
在相邻两个第一标记序列之间添加预置间隔字符，得到多个第二标记序列；
利用bert网络模型对所述多个第二标记序列进行训练，生成多个待检测声明句向量。

6.根据权利要求4所述的业务语音的质检方法，其特征在于，所述利用模糊匹配算法对所述目标待纠错文本进行...

【专利技术属性】
技术研发人员：石英伦，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人