质检数据训练方法、装置及系统制造方法及图纸

技术编号:33959227 阅读:38 留言:0更新日期:2022-06-30 00:12
本申请提供了一种质检数据训练方法、装置及系统,方法包括:获取质检数据训练集及对应的质检规则集;质检数据训练集包括:每个录音文件对应的至少一个目标质检点及每个目标质检点对应的录音问题内容;质检规则集包括基于每个目标质检点对应的录音问题内容构建的正则表达式规则;应用质检数据训练集对质检规则集进行训练,得到质检数据训练集对应的质检结果;质检结果包括每个录音文件对应的每个目标质检点的质检子结果;如果质检子结果为漏检结果和/或误检结果,对质检子结果对应的质检规则进行调整,对调整后的质检规则进行二次训练。本申请通过对一次训练出的问题规则进行调整,并进行二次训练,得到更加准确的训练结果。得到更加准确的训练结果。得到更加准确的训练结果。

【技术实现步骤摘要】
质检数据训练方法、装置及系统


[0001]本申请涉及计算机信息
,尤其是涉及一种质检数据训练方法、装置及系统。

技术介绍

[0002]数据训练是智能质检的重要环节之一,目前数据训练过程包括以下几个步骤,首先将接收到的语音文本转写成文本检测模型可识别文本文件,然后文本检测模块依据设定的检测规则对可识别文本文件进行检测,最后将含有不符合项的可识别文本文件对应的检测数据进行可视化显示。这种方式存在以下问题:数据训练仅包括一次训练过程,可能存在误检或漏检,使得训练结果不尽理想。

技术实现思路

[0003]本申请的目的在于提供一种质检数据训练方法、装置及系统,通过对一次训练出的问题规则进行调整,进行二次训练,得到更加准确的训练结果。
[0004]第一方面,本申请实施例提供一种质检数据训练方法,方法应用于质检数据训练系统;方法包括:获取质检数据训练集及对应的质检规则集;质检数据训练集包括:每个录音文件对应的至少一个目标质检点及每个目标质检点对应的录音问题内容;质检规则集包括基于每个目标质检点对应的录音问题内容构建的正则表达式规则;应用质检数据训练集对质检规则集进行训练,得到质检数据训练集对应的质检结果;质检结果包括每个录音文件对应的每个目标质检点的质检子结果;如果质检子结果为漏检结果和/或误检结果,对质检子结果对应的质检规则进行调整,对调整后的质检规则进行二次训练。
[0005]进一步地,上述系统存储有多个预设质检点;每个预设质检点对应有预设质检内容;获取质检数据训练集的步骤,包括:针对获取的每个录音文件,均执行以下操作;对录音文件进行语音识别,得到语音识别信息;语音识别信息包括文字信息、语速信息和/或语调信息;将语音识别信息与预设质检点对应的预设质检内容进行匹配,确定录音文件对应的目标质检点,及目标质检点对应的录音问题内容。
[0006]进一步地,上述应用质检数据训练集对质检规则集进行训练,得到质检数据训练集对应的质检结果的步骤,包括:依次将质检数据训练集中的每个录音文件作为当前录音文件,执行以下步骤:针对当前录音文件对应的每个目标质检点,从质检规则集中查找对应的目标质检规则;利用目标质检规则与目标质检点对应的录音问题内容进行匹配,确定目标质检点对应的质检子结果。
[0007]进一步地,上述应用质检数据训练集对质检规则集进行训练,得到质检数据训练集对应的质检结果的步骤之后,方法还包括:对质检数据训练集对应的质检结果进行显示。
[0008]进一步地,上述对质检数据训练集对应的质检结果进行显示的步骤,包括:如果质检结果包含的质检子结果为漏检结果和/或误检结果;对质检子结果按照指定格式进行显示。
[0009]进一步地,上述对质检子结果对应的质检规则进行调整的步骤,包括:如果质检子结果为漏检结果,在质检子结果对应的目标质检规则中添加指定内容;指定内容根据目标子结果对应的目标质检点的录音问题内容确定;如果质检子结果为误检结果,根据目标子结果对应的目标质检点的录音问题内容,对质检子结果对应的目标质检规则进行修改。
[0010]进一步地,上述对调整后的质检规则进行二次训练的步骤之后,方法还包括:获取录音清单测试集;应用录音清单测试集对调整后的质检规则集进行测试;根据测试结果确定质检规则的准确率,以便在准确率超过预设阈值时,对质检规则进行上线。
[0011]第二方面,本申请实施例还提供一种质检数据训练装置,装置应用于质检数据训练系统;装置包括:训练集规则集获取模块,用于获取质检数据训练集及对应的质检规则集;质检数据训练集包括:每个录音文件对应的至少一个目标质检点及每个目标质检点对应的录音问题内容;质检规则集包括基于每个目标质检点对应的录音问题内容构建的正则表达式规则;训练模块,用于应用质检数据训练集对质检规则集进行训练,得到质检数据训练集对应的质检结果;质检结果包括每个录音文件对应的每个目标质检点的质检子结果;二次训练模块,用于如果质检子结果为漏检结果和/或误检结果,对质检子结果对应的质检规则进行调整,对调整后的质检规则进行二次训练。
[0012]第三方面,本申请实施例还提供一种质检数据训练系统,系统包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现权利第一方面所述的方法。
[0013]第四方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述第一方面所述的方法。
[0014]本申请实施例提供的一种质检数据训练方法、装置及系统,首先获取质检数据训练集及对应的质检规则集;其中,质检数据训练集包括:每个录音文件对应的至少一个目标质检点及每个目标质检点对应的录音问题内容;质检规则集包括基于每个目标质检点对应的录音问题内容构建的正则表达式规则;然后应用质检数据训练集对质检规则集进行训练,即第一次训练,得到质检数据训练集对应的质检结果;质检结果包括每个录音文件对应的每个目标质检点的质检子结果;如果质检子结果为漏检结果和/或误检结果,对质检子结果对应的质检规则进行调整,对调整后的质检规则进行二次训练。本申请实施例通过对一次训练出的问题规则进行调整,并进行二次训练,能够得到更加准确的训练结果。
附图说明
[0015]为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1为本申请实施例提供的一种质检数据训练方法的流程图;
[0017]图2为本申请实施例提供的一种预设质检点列表的示意图;
[0018]图3为本申请实施例提供的一种录音清单的示意图;
[0019]图4为本申请实施例提供的一种质检结果的示意图;
[0020]图5为本申请实施例提供的一种质检数据训练装置的结构框图;
[0021]图6为本申请实施例提供的一种质检数据训练系统的结构示意图。
具体实施方式
[0022]下面将结合实施例对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]传统的质检数据训练过程包括以下几个步骤,首先将接收到的语音文本转写成文本检测模型可识别文本文件,然后文本检测模块依据设定的检测规则对可识别文本文件进行检测,最后将含有不符合项的可识别文本文件对应的检测数据进行可视化显示。这种方式存在以下问题:数据训练仅包括一次训练过程,可能存在误检或漏检的情况,使得训练结果不尽理想。
[0024]基于此,本申请实施例提供一种质检数据训练方法、装置及系统,通过对一次训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种质检数据训练方法,其特征在于,所述方法应用于质检数据训练系统;所述方法包括:获取质检数据训练集及对应的质检规则集;所述质检数据训练集包括:每个录音文件对应的至少一个目标质检点及每个所述目标质检点对应的录音问题内容;所述质检规则集包括基于所述每个目标质检点对应的录音问题内容构建的正则表达式规则;应用所述质检数据训练集对所述质检规则集进行训练,得到所述质检数据训练集对应的质检结果;所述质检结果包括每个录音文件对应的每个目标质检点的质检子结果;如果所述质检子结果为漏检结果和/或误检结果,对所述质检子结果对应的质检规则进行调整,对调整后的质检规则进行二次训练。2.根据权利要求1所述的方法,其特征在于,所述系统存储有多个预设质检点;每个预设质检点对应有预设质检内容;获取质检数据训练集的步骤,包括:针对获取的每个录音文件,均执行以下操作;对所述录音文件进行语音识别,得到语音识别信息;所述语音识别信息包括文字信息、语速信息和/或语调信息;将所述语音识别信息与所述预设质检点对应的预设质检内容进行匹配,确定所述录音文件对应的目标质检点,及所述目标质检点对应的录音问题内容。3.根据权利要求1所述的方法,其特征在于,应用所述质检数据训练集对所述质检规则集进行训练,得到所述质检数据训练集对应的质检结果的步骤,包括:依次将所述质检数据训练集中的每个录音文件作为当前录音文件,执行以下步骤:针对所述当前录音文件对应的每个目标质检点,从所述质检规则集中查找对应的目标质检规则;利用所述目标质检规则与所述目标质检点对应的录音问题内容进行匹配,确定所述目标质检点对应的质检子结果。4.根据权利要求1所述的方法,其特征在于,应用所述质检数据训练集对所述质检规则集进行训练,得到所述质检数据训练集对应的质检结果的步骤之后,所述方法还包括:对所述质检数据训练集对应的质检结果进行显示。5.根据权利要求4所述的方法,其特征在于,对所述质检数据训练集对应的质检结果进行显示的步骤,包括:如果所述质检结果包含的质检子结果为漏检结果和/或...

【专利技术属性】
技术研发人员:郑志敏王建辉吕超杜新凯
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1