基于视频交互的认证方法、系统以及相关装置制造方法及图纸

技术编号:38368280 阅读:8 留言:0更新日期:2023-08-05 17:33
本申请公开了一种基于视频交互的认证方法、系统以及相关装置,该方法包括:获取第一方和第二方交互时产生的初始视频流,确定所述初始视频流中的开始朗读标识和终止朗读标识;其中,所述开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应,所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应,所述第一客户端与所述第一方对应;基于所述开始朗读标识和所述终止朗读标识,从所述初始视频流中获得所述第一方的第一音频信息,并基于所述第一音频信息获得第一识别文本;基于所述第一识别文本和所述协议文本,判断是否完成认证。通过上述方式,本申请能够提高视频交互过程中认证的效率。够提高视频交互过程中认证的效率。够提高视频交互过程中认证的效率。

【技术实现步骤摘要】
基于视频交互的认证方法、系统以及相关装置


[0001]本申请涉及语音识别
,特别是涉及一种基于视频交互的认证方法、系统以及相关装置。

技术介绍

[0002]随着视频交互的不断发展,越来越多的业务可以在线办理,给用户带来更加便捷的体验。然而,在办理业务的过程中一般需要用户为自愿办理相应业务提供相应的证明;例如,朗读相关协议。常规的方式是由客服手举纸质协议供客户朗读,并在客户朗读结束后,人工判断所读内容与协议内容是否一致。该方式使得用户在读错后需要客服人员手动在纸质文件上指出相关错误,并引导客户重新朗读,导致整个业务办理过程耗时较长,效率较低。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种基于视频交互的认证方法、系统以及相关装置,能够提高视频交互过程中认证的效率。
[0004]为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于视频交互的认证方法,包括:获取第一方和第二方交互时产生的初始视频流,确定所述初始视频流中的开始朗读标识和终止朗读标识;其中,所述开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应,所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应,所述第一客户端与所述第一方对应;基于所述开始朗读标识和所述终止朗读标识,从所述初始视频流中获得所述第一方的第一音频信息,并基于所述第一音频信息获得第一识别文本;基于所述第一识别文本和所述协议文本,判断是否完成认证。
[0005]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种基于视频交互的认证方法,包括:响应于第一客户端向第二客户端发送视频请求指令,所述第二客户端响应所述视频请求指令,采集第一方和第二方交互时的初始视频流;其中,所述第一客户端与所述第一方对应,所述第二客户端与所述第二方对应;响应于所述第一方在所述第一客户端触发开始朗读协议文本,以及所述第一方在所述第一客户端触发终止朗读协议文本,所述第一客户端将开始朗读标识和终止朗读标识发送至所述第二客户端;其中,所述开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应,所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应;所述第二客户端基于所述开始朗读标识和所述终止朗读标识,从所述初始视频流中获得所述第一方的第一音频信息,并基于所述第一音频信息获得第一识别文本;所述第二客户端基于所述第一识别文本和所述协议文本,判断是否完成认证。
[0006]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种基于视频交互的认证系统,包括:接收模块,用于获取第一方和第二方交互时产生的初始视频流,确定所述初始视频流中的开始朗读标识和终止朗读标识;其中,所述开始朗读标识与第一客户端
上触发的开始朗读协议文本的时刻对应,所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应,所述第一客户端与所述第一方对应;处理模块,用于基于所述开始朗读标识和所述终止朗读标识,从所述初始视频流中获得所述第一方的第一音频信息,并基于所述第一音频信息获得第一识别文本;判断模块,用于基于所述第一识别文本和所述协议文本,判断是否完成认证。
[0007]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种电子设备,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现上述任一技术方案中所述的基于视频交互的认证方法。
[0008]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机可读存储介质,存储有能够被处理器运行的程序指令,所述程序指令用于实现上述任一技术方案中所述的基于视频交互的认证方法。
[0009]本申请的有益效果是:区别于现有技术的情况,本申请提出的认证方法通过从第一方和第二方进行交互产生的视频流中获取第一方朗读协议文本的第一音频信息,并从第一音频信息中识别出第一识别文本,根据第一识别文本与协议文本的比对结果判断是否完成认证。该方式无需第二方出示相关纸质协议,同时也无需第二方根据第一方的朗读内容进行人为判断,提高视频交互过程中认证的效率。
附图说明
[0010]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
[0011]图1是本申请基于视频交互的认证方法一实施方式的流程示意图;
[0012]图2是步骤S103另一实施方式的流程示意图;
[0013]图3是本申请基于视频交互的认证方法另一实施方式的流程示意图;
[0014]图4是本申请基于视频交互的认证系统一实施方式的结构示意图;
[0015]图5是本申请电子设备一实施方式的结构示意图;
[0016]图6是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
[0017]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0018]请参阅图1,图1是本申请基于视频交互的认证方法一实施方式的流程示意图。响应于第一方通过视频交互的方式在线办理相关业务,且在业务办理过程中,为了证明第一方自愿办理该业务,需要第一方朗读相关协议文本,以完成业务办理过程中的认证环节。其中,当执行主体为第二方对应的第二客户端时,具体的认证方法如下:
[0019]S101:获取第一方和第二方交互时产生的初始视频流,确定初始视频流中的开始
朗读标识和终止朗读标识;其中,开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应,终止朗读标识与第一客户端上触发的终止朗读协议文本的时刻对应,第一客户端与第一方对应。
[0020]在一实施方式中,步骤S101之前包括:响应于第一方和第二方进行视频交互以在线办理相应的业务,实时获取第一方和第二方在进行视频交互时所产生的初始视频流。该初始视频流中包括第一方的视频信息和音频信息,以及第二方的视频信息和音频信息。其中,第一方为客户,第二方为客服人员。
[0021]进一步地,响应于接收到第二方触发的协议文本显示指令,将协议文本以及阅读提示发送至第一客户端。
[0022]具体地,当业务办理过程中需要进行认证时,第二方在第二客户端上触发协议文本显示指令。其中,第二方与第二客户端对应,第二客户端可以为个人电脑、手机或平板等;第二方可以通过点击第二客户端屏幕上的相关区域或者点击第二客户端上的相关按钮以触发协议文本显示指令。当第二客户端接收到协议文本显示指令后,生成与当前办理业务相关的协议文本,并将该协议文本以及阅读提示发送至第一客户端。其中,第一客户端与第一方对应,第一客户端同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于视频交互的认证方法,其特征在于,包括:获取第一方和第二方交互时产生的初始视频流,确定所述初始视频流中的开始朗读标识和终止朗读标识;其中,所述开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应,所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应,所述第一客户端与所述第一方对应;基于所述开始朗读标识和所述终止朗读标识,从所述初始视频流中获得所述第一方的第一音频信息,并基于所述第一音频信息获得第一识别文本;基于所述第一识别文本和所述协议文本,判断是否完成认证。2.根据权利要求1所述的方法,其特征在于,所述基于所述开始朗读标识和所述终止朗读标识,从所述初始视频流中获得所述第一方的第一音频信息,并基于所述第一音频信息获得第一识别文本,包括:获取所述开始朗读标识对应的第一关键帧,以及获取所述终止朗读标识对应的第二关键帧;从所述初始视频流中,提取所述第一关键帧和所述第二关键帧及其之间的视频帧作为目标视频流;从所述目标视频流中提取所述第一音频信息,对所述第一音频信息进行识别以获得所述第一识别文本。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一识别文本和所述协议文本,判断是否完成认证,包括:响应于所述第一识别文本和所述协议文本一致,完成认证;或者,响应于所述协议文本与所述第一识别文本之间存在差异,基于所述协议文本与所述第一识别文本存在差异的部分确定差异文本,将所述差异文本发送至所述第一客户端,以使所述第一方朗读所述差异文本,从所述初始视频流中获取第二音频信息,并基于所述第二音频信息完成认证;其中,所述第二音频信息包括所述第一方朗读所述差异文本的音频。4.根据权利要求3所述的方法,其特征在于,所述基于所述协议文本与所述第一识别文本存在差异的部分确定差异文本,将所述差异文本发送至所述第一客户端,以使所述第一方朗读所述差异文本,从所述初始视频流中获取第二音频信息,并基于所述第二音频信息完成认证,包括:将所述差异文本在所述协议文本中进行标记,并将标记后的所述协议文本以及重读提示发送至所述第一客户端,以使所述第一方朗读所述差异文本;响应于所述第一方在所述第一客户端上触发终止朗读所述差异文本,获取所述初始视频流中的开始重读标识和终止重读标识;其中,所述开始重读标识与所述第一客户端上触发的开始朗读所述差异文本的时刻对应,所述终止重读标识与所述第一客户端上触发的终止朗读所述差异文本的时刻对应;基于所述开始重读标识和所述终止重读标识,从所述初始视频流中获得所述第二音频信息,并对所述第二音频信息进行识别以获得第二识别文本;将所述第二识别文本与所述差异文本进行比对,以判断是否完成认证。5.根据权利要求4所述的方法,其特征在于,所述将所述第二识别文本与所述差异文本进行比对,以判断是否完成认证,包括:
...

【专利技术属性】
技术研发人员:吴为蔡翱王和潭
申请(专利权)人:讯飞华中武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1