一种音视频会话优化方法、装置及存储介质制造方法及图纸

技术编号：37056275 阅读：14 留言：0更新日期：2023-03-29 19:33

本发明专利技术公开了一种音视频会话优化方法、装置及存储介质，所述方法包括：确定处于发言状态的目标对象，并获取与目标对象对应的目标视频窗口；判断目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致；当所述目标对象与所述中心对象不一致时，将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域，同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。本发明专利技术能够在视频在线业务办理的过程中，降低工作人员操作的复杂度；能够使当前对应节点的对应双方能够快速进入对方注视范围，进行有效的沟通；参与办理的人员中途有疑问说明，能够第一时间被工作人员关注和应答，提高了业务办理效率。提高了业务办理效率。提高了业务办理效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种音视频会话优化方法、装置及存储介质

[0001]本专利技术涉及信息处理
，并且更具体地，涉及一种音视频会话优化方法、装置及存储介质。

技术介绍

[0002]在金融行业远程业务办理的场景中，经常需要分属于异地的多人进行音视频会话，同时需要将音视频会话过程进行录制存档作为业务办理的基础审核资料以便备查。
[0003]目前在进行远程业务办理的过程中是由一个工作人员及数名业务办理人员共同进入一个聊天室，工作人员可以实时看到所有参与业务办理人员的视频画面，画面如图1所示。每个业务办理人员也可以实时看到包括工作人员在内的其它所有人员，画面如图2所示。
[0004]现有技术的缺点是：1.工作人员看到的所有业务办理人员音视频画面位置是固定的如果某一个业务办理人员有问题通过语音讲述给工作人员，工作人员很难清楚知晓是哪一个业务办理人员在发言。2.在线音视频业务流程在办理的过程中，业务流程分为多个环节，每个环节可能需要响应的人来做应答，比如一笔贷款，就需要主贷款人、担保人(若干个)同时在框，目前的方案为，银行工作人员看到的画面中，处于中央画面的人，是工作人员手动拖进来放大的，如果工作人员忘记了拖动或者拖动错误，就会导致当前环节需要配合的人(主贷款人或者担保人)的画面没有处于中央位置被放大，从而影响沟通的效率和业务办理的有效性。
[0005]因此，需要一种音视频会话优化方法。

技术实现思路

[0006]本专利技术要解决的问题包括如何实现音视频会话过程中发言的业务人员的自动识别，并将发言的业务...

【技术保护点】

【技术特征摘要】
1.一种音视频会话优化方法，其特征在于，所述方法包括：确定处于发言状态的目标对象，并获取与所述目标对象对应的目标视频窗口；判断所述目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致；当所述目标对象与所述中心对象不一致时，将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域，同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。2.根据权利要求1所述的方法，其特征在于，所述确定处于发言状态的目标对象，包括：确定当前的业务节点，根据业务节点和角色的关联关系匹配与所述当前的业务节点对应的角色，根据与所述当前的业务节点对应的角色确定所述处于发言状态的目标对象。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：将业务流程切分为至少一个业务节点，并配置与每个业务节点对应的角色，建立所述业务节点和角色的关联关系。4.根据权利要求2所述的方法，其特征在于，所述方法还包括：当一个业务节点对应多个角色时，进行人声监测，并响应于接收到工作人员输入的第一语音数据，对所述第一语音数据进行语音识别，获取识别结果；根据所述识别结果确定处于发言状态的目标对象。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：基于NLP自然语言处理技术对所述语音数据进行语音识别，获取识别结果。6.根据权利要求1所述的方法，其特征在于，所述确定处于发言状态的目标对象，包括：在业务办理过程中，实时地进行语音监测；当...

【专利技术属性】
技术研发人员：宁世杰，夏溧，刘涛，
申请(专利权)人：北京中关村科金技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人