【技术实现步骤摘要】
一种文本质量的检测方法、装置、电子设备及存储介质
[0001]本申请涉及语音处理
,具体而言,涉及一种文本质量的检测方法、装置、电子设备及存储介质。
技术介绍
[0002]现阶段,在金融、保险、证券等行业中,监管部门要求业务员在向客户推销高风险金融产品时,将金融产品详尽的风险信息告知客户,并录制告知过程的双录音视频,以便监管部门基于双录音视频,对金融产品交易过程的合规性进行监管。
[0003]实际中,金融产品均对应有风险告知模板文本,在金融产品交易过程中采集双录音视频,将双录音视频的音频转换为风险告知待检测文本,并根据风险告知待检测文本和风险告知模板文本,确定该次金融产品交易是否合规。
[0004]但是,风险告知待检测文本与风险告知模板文本包括的字符数差距较大,通过比对两个文本的方式,容易造成文本质量检测的准确度低下。
技术实现思路
[0005]有鉴于此,本申请实施例的目的在于提供一种文本质量的检测方法、装置、电子设备及存储介质,能够通过从待检测文本中选取每个提问模板子语句对应的待检测提 ...
【技术保护点】
【技术特征摘要】
1.一种文本质量的检测方法,其特征在于,所述检测方法包括:获取待检测双录音视频中的待检测音频对应的待检测文本,以及与所述待检测文本的文本类型相匹配的提问模板文本;其中,所述待检测文本中包括待检测提问子语句和待检测答复子语句;针对所述提问模板文本中的每个提问模板子语句,根据该提问模板子语句中包括的字符的目标数量,从所述待检测文本中选取多个由所述目标数量个相邻的字符组成的待检测提问字符串;根据各个提问模板子语句与其分别对应的每个待检测提问字符串之间的相似度,从每个提问模板子语句对应的多个待检测提问字符串中,选取相似度符合预设要求的待检测提问字符串,作为该提问模板子语句对应的待检测提问子语句;根据各个子提问模板文本中的首尾句分别对应的待检测提问子语句在所述待检测文本中的位置,从所述待检测文本中选取每个子提问模板文本对应的待检测答复子语句;其中,所述提问模板文本由多个所述子提问模板文本组成;若各个子提问模板文本对应的待检测答复子语句中均包括预设的肯定答复字符串,则确定所述待检测文本的质量合格。2.根据权利要求1所述的文本质量的检测方法,其特征在于,所述根据各个提问模板子语句与其分别对应的每个待检测提问字符串之间的相似度,从每个提问模板子语句对应的多个待检测提问字符串中,选取相似度符合预设要求的待检测提问字符串,作为该提问模板子语句对应的待检测提问子语句,包括:针对每个提问模板子语句,确定该提问模板子语句与该提问模板子语句的每个待检测提问字符串之间的相似度;将所述相似度大于预设阈值的待检测提问字符串,确定为该提问模板子语句的候选待检测提问子语句;根据各个提问模板子语句与其分别对应的每个候选待检测提问子语句之间的相似度,确定每个提问模板子语句对应的待检测提问子语句。3.根据权利要求1所述的文本质量的检测方法,其特征在于,通过如下方式检测每个待检测答复子语句中是否包括预设的肯定答复字符串:针对每个待检测答复子语句,依次检测该待检测答复子语句中是否包括预设的干扰字符串、预设的否定回答字符串、预设的肯定回答字符串;其中,所述干扰字符串的长度大于所述否定回答字符串的长度,所述否定回答字符串的长度大于所述肯定回答字符串的长度;若该待检测答复子语句中包括的所述干扰字符串和所述否定回答字符串的数量,小于包括的所述肯定回答字符串的数量,则确定该待检测答复子语句中包括所述肯定答复字符串。4.根据权利要求1所述的文本质量的检测方法,其特征在于,通过如下方式获取所述待检测文本:将待检测双录音视频中的待检测音频输入至预先训练好的语音转写模型中,确定所述待检测音频对应的待检测文本。5.根据权利要求1所述的文本质量的检测方法,其特征在于,在获取待检测双录音视频
中的待检测音频对应的待检测文本之前,所述检测方法还包括:将待检测音频输入至预先训练好的关键词检索模型中,确定所述待检测音频中是否包括非法关键词;若所述待检测音频中不包括非法关键词,则获取所述待检测音频对应...
【专利技术属性】
技术研发人员:胡广宇,邓菁,吴富章,
申请(专利权)人:北京远鉴信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。