数据稽核方法技术

技术编号:39398481 阅读:4 留言:0更新日期:2023-11-19 15:52
本申请涉及数据稽核技术领域,提供一种数据稽核方法

【技术实现步骤摘要】
数据稽核方法、装置、电子设备及计算机存储介质


[0001]本申请涉及数据稽核
,尤其涉及一种数据稽核方法

装置

电子设备及计算机存储介质


技术介绍

[0002]现有的数据稽核方法是:客户致电运营商客服中心进行投诉,客服对投诉客户有固有的问卷话术规范,并让客户对运营商服务进行打分

进一步地,通过人工方式听取录音,并与相应的问卷进行人工核对

因此,现有的数据稽核方法需要人工抽检录音测听,并通过人工方式对其判断,同时通过人工方式对测听后提取的问卷答案与人工记录进行对比

由于人工方式存在主观意识,从而导致了容易出错,使得数据稽核的准确率低


技术实现思路

[0003]本申请提供一种数据稽核方法

装置

电子设备及计算机存储介质,旨在提升数据稽核的准确率

[0004]第一方面,本申请提供一种数据稽核方法,包括:
[0005]通过深度全序列卷积的神经网络语音识别框架对待处理语音文件进行语音转写,得到转写文本;
[0006]通过
Skip

Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型;
[0007]通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集;
[0008]根据所述候选答案集中各个候选答案的度量值确定最终答案,并将所述最终答案结合人工处理问卷答案进行答案稽核

[0009]在一个实施例中,所述通过
Skip

Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型,包括:
[0010]对所述转写文本进行数据容错处理

标点符号去除处理和数据标准化处理,得到所述转写文本的语音文本;
[0011]通过
Skip

Gram
算法的语言模型对所述语音文本及其模板问题数据进行学习,得到模板问题语义特征信息和源问题语义特征信息;
[0012]基于所述模板问题语义特征信息和所述源问题语义特征信息,得到所述转写文本的待分析问题数据和问题类型

[0013]所述基于所述模板问题语义特征信息和所述源问题语义特征信息,得到所述转写文本的待分析问题数据和问题类型,包括:
[0014]通过所述模板问题语义特征信息和所述源问题语义特征信息,计算所述转写文本中语音文本问题数据和模板问题数据的语义相似值;
[0015]将所述语义相似值与相似度阈值进行大小比较,得到比较结果;
[0016]根据所述比较结果输出所述转写文本的待分析问题数据和问题类型

[0017]所述根据所述候选答案集中各个候选答案的度量值确定最终答案,包括:
[0018]计算所述候选答案集中各个候选答案的度量值,并将各个候选答案的度量值进行数值大小比较,得到比较结果;
[0019]根据所述比较结果确定各个候选答案的度量值中数值最大的度量值,并将所述数值最大的度量值的候选答案确定为所述最终答案

[0020]所述通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集,包括:
[0021]确定所述待分析问题数据中的各个关键字信息,并根据各个所述关键字信息确定查询条件;
[0022]根据所述查询条件返回所述待分析问题数据的候选片段文本,并对所述候选片段文本进行文本过滤,得到目标问题文本;
[0023]根据所述问题类型确定答案类型,并通过所述命名实体识别算法结合所述目标问题文本和所述答案类型,确定所述候选答案集

[0024]所述通过所述命名实体识别算法结合所述目标问题文本和所述答案类型,确定所述候选答案集,包括:
[0025]通过所述命名实体识别算法并根据所述答案类型,对所述目标问题文本进行识别,得到所述目标问题文本的各个候选实体;
[0026]将各个所述候选实体确定为各个候选答案,并将各个候选答案进行集合,得到所述候选答案集

[0027]所述将所述最终答案结合人工处理问卷答案进行答案稽核,包括:
[0028]将所述最终答案与所述人工处理问卷答案进行答案一致对比,得到对比结果;
[0029]若所述对比结果为所述最终答案与所述人工处理问卷答案的答案一致,则确定所述最终答案正确;
[0030]若所述对比结果为所述最终答案与所述人工处理问卷答案的答案不一致,则确定所述最终答案错误

[0031]第二方面,本申请提供一种数据稽核装置包括:
[0032]语音转写模块,用于通过深度全序列卷积的神经网络语音识别框架对待处理语音文件进行语音转写,得到转写文本;
[0033]处理模块,用于通过
Skip

Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型;
[0034]确定模块,用于通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集;
[0035]确定稽核模块,用于根据所述候选答案集中各个候选答案的度量值确定最终答案,并将所述最终答案结合人工处理问卷答案进行答案稽核

[0036]第三方面,本申请还提供一种电子设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述数据稽核方法

[0037]第四方面,本申请还提供一种非暂态计算机可读存储介质,所述非暂态计算机可
读存储介质包括计算机程序,所述计算机程序被所述处理器执行时实现第一方面所述数据稽核方法

[0038]第五方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被所述处理器执行时实现第一方面所述数据稽核方法

[0039]本申请提供的数据稽核方法

装置

电子设备及计算机存储介质,在数据稽核的过程中,通过深度全序列卷积的神经网络语音识别框架
、Skip

Gram
算法

文本匹配

命名实体识别算法和各个候选答案的度量值,精准确定出待处理语音文件的最终答案,并智能化地将最终答案与人工处理问卷答案进行稽核,减少人为主观因素的干扰,提升了数据稽核的准确率

附图说明
[0040]为了更清楚地说明本申请的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据稽核方法,其特征在于,包括:通过深度全序列卷积的神经网络语音识别框架对待处理语音文件进行语音转写,得到转写文本;通过
Skip

Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型;通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集;根据所述候选答案集中各个候选答案的度量值确定最终答案,并将所述最终答案结合人工处理问卷答案进行答案稽核
。2.
根据权利要求1所述的数据稽核方法,其特征在于,所述通过
Skip

Gram
算法结合文本匹配对所述转写文本进行处理,得到所述转写文本的待分析问题数据和问题类型,包括:对所述转写文本进行数据容错处理

标点符号去除处理和数据标准化处理,得到所述转写文本的语音文本;通过
Skip

Gram
算法的语言模型对所述语音文本及其模板问题数据进行学习,得到模板问题语义特征信息和源问题语义特征信息;基于所述模板问题语义特征信息和所述源问题语义特征信息,得到所述转写文本的待分析问题数据和问题类型
。3.
根据权利要求2所述的数据稽核方法,其特征在于,所述基于所述模板问题语义特征信息和所述源问题语义特征信息,得到所述转写文本的待分析问题数据和问题类型,包括:通过所述模板问题语义特征信息和所述源问题语义特征信息,计算所述转写文本中语音文本问题数据和模板问题数据的语义相似值;将所述语义相似值与相似度阈值进行大小比较,得到比较结果;根据所述比较结果输出所述转写文本的待分析问题数据和问题类型
。4.
根据权利要求1所述的数据稽核方法,其特征在于,所述根据所述候选答案集中各个候选答案的度量值确定最终答案,包括:计算所述候选答案集中各个候选答案的度量值,并将各个候选答案的度量值进行数值大小比较,得到比较结果;根据所述比较结果确定各个候选答案的度量值中数值最大的度量值,并将所述数值最大的度量值的候选答案确定为所述最终答案
。5.
根据权利要求1所述的数据稽核方法,其特征在于,所述通过命名实体识别算法结合所述待分析问题数据和所述问题类型,确定候选答案集,包括:确...

【专利技术属性】
技术研发人员:王博岳烈骥孙伟朱世军侯普
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1