【技术实现步骤摘要】
数据稽核方法、装置、电子设备及计算机存储介质
[0001]本申请涉及数据稽核
,尤其涉及一种数据稽核方法
、
装置
、
电子设备及计算机存储介质
。
技术介绍
[0002]现有的数据稽核方法是:客户致电运营商客服中心进行投诉,客服对投诉客户有固有的问卷话术规范,并让客户对运营商服务进行打分
。
进一步地,通过人工方式听取录音,并与相应的问卷进行人工核对
。
因此,现有的数据稽核方法需要人工抽检录音测听,并通过人工方式对其判断,同时通过人工方式对测听后提取的问卷答案与人工记录进行对比
。
由于人工方式存在主观意识,从而导致了容易出错,使得数据稽核的准确率低
。
技术实现思路
[0003]本申请提供一种数据稽核方法
、
装置
、
电子设备及计算机存储介质,旨在提升数据稽核的准确率
。
[0004]第一方面,本申请提供一种数据稽核方法,包括:
[0005]通过深度全序列卷积的神经网络语音识别框架对待处理语音文件进行语音转写,得到转写文本;
[0006]通过
Skip
‑
Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型;
[0007]通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集;
[0008]根据所述候选答案集中各个候选答案的 ...
【技术保护点】
【技术特征摘要】
1.
一种数据稽核方法,其特征在于,包括:通过深度全序列卷积的神经网络语音识别框架对待处理语音文件进行语音转写,得到转写文本;通过
Skip
‑
Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型;通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集;根据所述候选答案集中各个候选答案的度量值确定最终答案,并将所述最终答案结合人工处理问卷答案进行答案稽核
。2.
根据权利要求1所述的数据稽核方法,其特征在于,所述通过
Skip
‑
Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型,包括:对所述转写文本进行数据容错处理
、
标点符号去除处理和数据标准化处理,得到所述转写文本的语音文本;通过
Skip
‑
Gram
算法的语言模型对所述语音文本及其模板问题数据进行学习,得到模板问题语义特征信息和源问题语义特征信息;基于所述模板问题语义特征信息和所述源问题语义特征信息,得到所述转写文本的待分析问题数据和问题类型
。3.
根据权利要求2所述的数据稽核方法,其特征在于,所述基于所述模板问题语义特征信息和所述源问题语义特征信息,得到所述转写文本的待分析问题数据和问题类型,包括:通过所述模板问题语义特征信息和所述源问题语义特征信息,计算所述转写文本中语音文本问题数据和模板问题数据的语义相似值;将所述语义相似值与相似度阈值进行大小比较,得到比较结果;根据所述比较结果输出所述转写文本的待分析问题数据和问题类型
。4.
根据权利要求1所述的数据稽核方法,其特征在于,所述根据所述候选答案集中各个候选答案的度量值确定最终答案,包括:计算所述候选答案集中各个候选答案的度量值,并将各个候选答案的度量值进行数值大小比较,得到比较结果;根据所述比较结果确定各个候选答案的度量值中数值最大的度量值,并将所述数值最大的度量值的候选答案确定为所述最终答案
。5.
根据权利要求1所述的数据稽核方法,其特征在于,所述通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集,包括:确...
【专利技术属性】
技术研发人员:王博,岳烈骥,孙伟,朱世军,侯普,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。