一种双录视频质检方法、装置、设备及可读存储介质制造方法及图纸

技术编号:33905788 阅读:15 留言:0更新日期:2022-06-25 18:38
本发明专利技术提供了一种双录视频质检方法、装置、设备及可读存储介质,该方法包括:获取待质检视频文件,并对待质检视频文件进行拆分处理,得到待质检视频文件的图像数据和音频数据;根据业务环节分别将图像数据和音频数据划分为多组质检图像帧和多组质检音频段;基于各业务环节对应的预设质检规则对各组质检图像帧进行图像质检;基于各业务环节对应的预设标准话术内容对各组质检音频段进行音频质检。基于本发明专利技术提供的方案,可以实现双录视频质检智能化,不合规问题可追溯,相较于传统的人工质检,可以大大节省人力资源且能有效降低质检出错率,使双录视频质检流程标准统一,严谨合规。严谨合规。严谨合规。

【技术实现步骤摘要】
一种双录视频质检方法、装置、设备及可读存储介质


[0001]本专利技术涉及计算机
,特别是一种双录视频质检方法、装置、设备及可读存储介质。

技术介绍

[0002]“双录”即录音和录像,一般用于金融投资理财行业,要求业务人员在进行业务签约或业务产品购买的过程中,应对关键环节以现场同步录音录像的方式予以记录,是对业务人员在进行业务销售时的一种行为规范。双录视频在录制后,需要对视频质量进行检测,保证视频内环节完整,行为合规。人工质检双录视频的速度和效率较低,一单双录视频时长12

15分钟,人工质检需要相同时长,理想情况下,一人一天只能质检32

40单视频,导致质检速度慢效率低,另一方面,人工质检对于质检要求不能做到完全统一且容易出错。

技术实现思路

[0003]基于上述问题,本专利技术提供一种双录视频质检方法、装置、设备及可读存储介质,可实现智能化检测双录视频质量,其通过将待检测视频文件拆分为图像数据和音频数据,根据不同业务环节的质检特点分别对图像数据和音频数据进行质检,从而完成对双录视频准确高效的质检。
[0004]依据本专利技术第一方面,提供了一种双录视频质检方法,包括:
[0005]获取待质检视频文件,并对所述待质检视频文件进行拆分处理,得到所述待质检视频文件的图像数据和音频数据;
[0006]根据业务环节分别将所述图像数据和所述音频数据划分为多组质检图像帧和多组质检音频段;
[0007]基于各所述业务环节对应的预设质检规则对各组所述质检图像帧进行图像质检;
[0008]基于各所述业务环节对应的预设标准话术内容对各组所述质检音频段进行音频质检。
[0009]可选地,所述业务环节至少包括身份证明文件展示环节、业务文件展示环节、签字动作执行环节及信息确认环节。
[0010]可选地,所述根据业务环节分别将所述图像数据和所述音频数据划分为多组质检图像帧和质检音频段之前,还包括:
[0011]基于所述图像数据间隔抽取多个目标图像帧;
[0012]基于所述多个目标图像帧对所述待质检视频关联的业务负责人及业务申请人进行身份验证,并计算所述业务负责人及所述业务申请人的同框率。
[0013]可选地,所述基于各所述业务环节对应的预设质检规则对各组所述质检图像帧进行图像质检,包括:
[0014]在所述身份证明文件展示环节,基于对应的所述质检图像帧进行图像检测,判断所述业务申请人的身份证明文件是否成功展示,以及所述身份证明文件与所述业务申请人
信息是否匹配;
[0015]在所述业务文件展示环节,基于对应的所述质检图像帧进行文字检测,判断业务文件是否成功展示;
[0016]在所述签字动作执行环节,基于对应的所述质检图像帧进行物体区域检测判断签字动作是否成功执行。
[0017]可选地,所述基于各所述业务环节对应的预设标准话术内容对各组所述质检音频段进行音频质检,包括:
[0018]对各组所述质检音频段进行语音识别;
[0019]基于各业务环节对应的所述预设标准话术内容与各所述质检音频段的语音识别结果进行语义匹配,输出语义相似度概率值;
[0020]根据所述语义相似度概率值判断所述质检音频段是否满足质检条件。
[0021]可选地,所述方法还包括:
[0022]基于各组所述质检图像帧和各组所述质检音频段的质检结果生成质检报告;
[0023]所述质检报告至少包括身份证明文件是否成功展示、身份证明文件与业务申请人信息是否成功匹配、业务文件是否成功展示、签字动作是否成功执行;和/或,
[0024]各组所述质检音频段与预设标准话术内容对比的语义相似程度概率值。
[0025]可选地,所述方法还包括:
[0026]识别所述待质检视频文件包括设定动作的多组关键视频段和不包括设定动作的多组非关键视频段;
[0027]基于所述多组关键视频段按照第一预设频率提取多帧第一图像帧,基于所述多组非关键视频段按照第二预设频率提取多帧第二图像帧,所述第一预设频率高于所述第二预设频率;
[0028]按照时间顺序将所述第一图像帧和所述第二图像帧合成所述待质检视频文件的简视频。
[0029]依据本专利技术第二方面,提供了一种双录视频的质检装置,包括:
[0030]获取模块,用于获取待质检视频文件,并对所述待质检视频文件进行拆分处理,得到所述待质检视频文件的图像数据和音频数据;
[0031]划分模块,用于根据业务环节分别将所述图像数据和所述音频数据划分为多组质检图像帧和多组质检音频段;
[0032]图像质检模块,用于基于各所述业务环节对应的预设质检规则对各组所述质检图像帧进行图像质检;
[0033]音频质检模块,用于基于各所述业务环节对应的预设标准话术内容对各组所述质检音频段进行音频质检。
[0034]可选地,所述装置还包括:
[0035]同框率计算模块,用于基于所述图像数据间隔抽取多个目标图像帧;
[0036]基于所述多个目标图像帧对所述待质检视频关联的业务负责人及业务申请人进行身份验证,并计算所述业务负责人及所述业务申请人的同框率。
[0037]可选地,所述图像质检模块还用于:
[0038]在身份证明文件展示环节,基于对应的所述质检图像帧进行图像检测,判断所述
业务申请人的身份证明文件是否成功展示,以及所述身份证明文件与所述业务申请人信息是否匹配;
[0039]在业务文件展示环节,基于对应的所述质检图像帧进行文字检测,判断业务文件是否成功展示;
[0040]在签字动作执行环节,基于对应的所述质检图像帧进行物体区域检测判断签字动作是否成功执行。
[0041]可选地,所述音频质检模块还用于:
[0042]对各组所述质检音频段进行语音识别;
[0043]基于各业务环节对应的所述预设标准话术内容与各所述质检音频段的语音识别结果进行语义匹配,输出语义相似度概率值;
[0044]根据所述语义相似度概率值判断所述质检音频段是否满足质检条件。
[0045]可选地,所述装置还包括:
[0046]质检报告生成模块,用于基于各组所述质检图像帧和各组所述质检音频段的质检结果生成质检报告;
[0047]所述质检报告至少包括身份证明文件是否成功展示、身份证明文件与业务申请人信息是否成功匹配、业务文件是否成功展示、签字动作是否成功执行;和/或,
[0048]各组所述质检音频段与预设标准话术内容对比的语义相似程度概率值。
[0049]可选地,所述装置还包括:
[0050]简视频生成模块,用于识别所述待质检视频文件包括设定动作的多组关键视频段和不包括设定动作的多组非关键视频段;
[0051]基于所述多组关键视频段按照第一预设频率提取多帧第一图像帧,基于所述多组非关键视频段按照第二预设频率提取多帧第二图像帧,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种双录视频质检方法,其特征在于,包括:获取待质检视频文件,并对所述待质检视频文件进行拆分处理,得到所述待质检视频文件的图像数据和音频数据;根据业务环节分别将所述图像数据和所述音频数据划分为多组质检图像帧和多组质检音频段;基于各所述业务环节对应的预设质检规则对各组所述质检图像帧进行图像质检;基于各所述业务环节对应的预设标准话术内容对各组所述质检音频段进行音频质检。2.根据权利要求1所述的方法,其特征在于,所述业务环节至少包括身份证明文件展示环节、业务文件展示环节、签字动作执行环节及信息确认环节。3.根据权利要求1所述的方法,其特征在于,所述根据业务环节分别将所述图像数据和所述音频数据划分为多组质检图像帧和质检音频段之前,还包括:基于所述图像数据间隔抽取多个目标图像帧;基于所述多个目标图像帧对所述待质检视频关联的业务负责人及业务申请人进行身份验证,并计算所述业务负责人及所述业务申请人的同框率。4.根据权利要求2所述的方法,其特征在于,所述基于各所述业务环节对应的预设质检规则对各组所述质检图像帧进行图像质检,包括:在所述身份证明文件展示环节,基于对应的所述质检图像帧进行图像检测,判断所述业务申请人的身份证明文件是否成功展示,以及所述身份证明文件与所述业务申请人信息是否匹配;在所述业务文件展示环节,基于对应的所述质检图像帧进行文字检测,判断业务文件是否成功展示;在所述签字动作执行环节,基于对应的所述质检图像帧进行物体区域检测判断签字动作是否成功执行。5.根据权利要求1所述的方法,其特征在于,所述基于各所述业务环节对应的预设标准话术内容对各组所述质检音频段进行音频质检,包括:对各组所述质检音频段进行语音识别;基于各业务环节对应的所述预设标准话术内容与各所述质检音频段的语音识别结果进行语义匹配,输出语义相似度概率值;根据所述语义相似...

【专利技术属性】
技术研发人员:慈祥蒋焱赵薇赵星敏安书山
申请(专利权)人:中国银行保险信息技术管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1