基于视频交互的认证方法、系统以及相关装置制造方法及图纸

技术编号：38368280 阅读：8 留言：0更新日期：2023-08-05 17:33

本申请公开了一种基于视频交互的认证方法、系统以及相关装置，该方法包括：获取第一方和第二方交互时产生的初始视频流，确定所述初始视频流中的开始朗读标识和终止朗读标识；其中，所述开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应，所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应，所述第一客户端与所述第一方对应；基于所述开始朗读标识和所述终止朗读标识，从所述初始视频流中获得所述第一方的第一音频信息，并基于所述第一音频信息获得第一识别文本；基于所述第一识别文本和所述协议文本，判断是否完成认证。通过上述方式，本申请能够提高视频交互过程中认证的效率。够提高视频交互过程中认证的效率。够提高视频交互过程中认证的效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于视频交互的认证方法、系统以及相关装置

[0001]本申请涉及语音识别
，特别是涉及一种基于视频交互的认证方法、系统以及相关装置。

技术介绍

[0002]随着视频交互的不断发展，越来越多的业务可以在线办理，给用户带来更加便捷的体验。然而，在办理业务的过程中一般需要用户为自愿办理相应业务提供相应的证明；例如，朗读相关协议。常规的方式是由客服手举纸质协议供客户朗读，并在客户朗读结束后，人工判断所读内容与协议内容是否一致。该方式使得用户在读错后需要客服人员手动在纸质文件上指出相关错误，并引导客户重新朗读，导致整个业务办理过程耗时较长，效率较低。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种基于视频交互的认证方法、系统以及相关装置，能够提高视频交互过程中认证的效率。
[0004]为解决上述技术问题，本申请采用的一个技术方案是：提供一种基于视频交互的认证方法，包括：获取第一方和第二方交互时产生的初始视频流，确定所述初始视频流中的开始朗读标识和终止朗读标识；其中，所述开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应，所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应，所述第一客户端与所述第一方对应；基于所述开始朗读标识和所述终止朗读标识，从所述初始视频流中获得所述第一方的第一音频信息，并基于所述第一音频信息获得第一识别文本；基于所述第一识别文本和所述协议文本，判断是否完成认证。
[0005]为解决上述技术问题，本申请采用的另一个技术方案是：提供...

【技术保护点】

【技术特征摘要】
1.一种基于视频交互的认证方法，其特征在于，包括：获取第一方和第二方交互时产生的初始视频流，确定所述初始视频流中的开始朗读标识和终止朗读标识；其中，所述开始朗读标识与第一客户端上触发的开始朗读协议文本的时刻对应，所述终止朗读标识与所述第一客户端上触发的终止朗读所述协议文本的时刻对应，所述第一客户端与所述第一方对应；基于所述开始朗读标识和所述终止朗读标识，从所述初始视频流中获得所述第一方的第一音频信息，并基于所述第一音频信息获得第一识别文本；基于所述第一识别文本和所述协议文本，判断是否完成认证。2.根据权利要求1所述的方法，其特征在于，所述基于所述开始朗读标识和所述终止朗读标识，从所述初始视频流中获得所述第一方的第一音频信息，并基于所述第一音频信息获得第一识别文本，包括：获取所述开始朗读标识对应的第一关键帧，以及获取所述终止朗读标识对应的第二关键帧；从所述初始视频流中，提取所述第一关键帧和所述第二关键帧及其之间的视频帧作为目标视频流；从所述目标视频流中提取所述第一音频信息，对所述第一音频信息进行识别以获得所述第一识别文本。3.根据权利要求1所述的方法，其特征在于，所述基于所述第一识别文本和所述协议文本，判断是否完成认证，包括：响应于所述第一识别文本和所述协议文本一致，完成认证；或者，响应于所述协议文本与所述第一识别文本之间存在差异，基于所述协议文本与所述第一识别文本存在差异的部分确定差异文本，将所述差异文本发送至所述第一客户端，以使所述第一方朗读所述差异文本，从所述初始视频流中获取第二音频信息，并基于所述第二音频信息完成认证；其中，所述第二音频信息包括所述第一方朗读所述差异文本的音频。4.根据权利要求3所述的方法，其特征在于，所述基于所述协议文本与所述第一识别文本存在差异的部分确定差异文本，将所述差异文本发送至所述第一客户端，以使所述第一方朗读所述差异文本，从所述初始视频流中获取第二音频信息，并基于所述第二音频信息完成认证，包括：将所述差异文本在所述协议文本中进行标记，并将标记后的所述协议文本以及重读提示发送至所述第一客户端，以使所述第一方朗读所述差异文本；响应于所述第一方在所述第一客户端上触发终止朗读所述差异文本，获取所述初始视频流中的开始重读标识和终止重读标识；其中，所述开始重读标识与所述第一客户端上触发的开始朗读所述差异文本的时刻对应，所述终止重读标识与所述第一客户端上触发的终止朗读所述差异文本的时刻对应；基于所述开始重读标识和所述终止重读标识，从所述初始视频流中获得所述第二音频信息，并对所述第二音频信息进行识别以获得第二识别文本；将所述第二识别文本与所述差异文本进行比对，以判断是否完成认证。5.根据权利要求4所述的方法，其特征在于，所述将所述第二识别文本与所述差异文本进行比对，以判断是否完成认证，包括：
...

【专利技术属性】
技术研发人员：吴为，蔡翱，王和潭，
申请(专利权)人：讯飞华中武汉有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人