一种音视频会话优化方法、装置及存储介质制造方法及图纸

技术编号:37056275 阅读:14 留言:0更新日期:2023-03-29 19:33
本发明专利技术公开了一种音视频会话优化方法、装置及存储介质,所述方法包括:确定处于发言状态的目标对象,并获取与目标对象对应的目标视频窗口;判断目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致;当所述目标对象与所述中心对象不一致时,将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域,同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。本发明专利技术能够在视频在线业务办理的过程中,降低工作人员操作的复杂度;能够使当前对应节点的对应双方能够快速进入对方注视范围,进行有效的沟通;参与办理的人员中途有疑问说明,能够第一时间被工作人员关注和应答,提高了业务办理效率。提高了业务办理效率。提高了业务办理效率。

【技术实现步骤摘要】
一种音视频会话优化方法、装置及存储介质


[0001]本专利技术涉及信息处理
,并且更具体地,涉及一种音视频会话优化方法、装置及存储介质。

技术介绍

[0002]在金融行业远程业务办理的场景中,经常需要分属于异地的多人进行音视频会话,同时需要将音视频会话过程进行录制存档作为业务办理的基础审核资料以便备查。
[0003]目前在进行远程业务办理的过程中是由一个工作人员及数名业务办理人员共同进入一个聊天室,工作人员可以实时看到所有参与业务办理人员的视频画面,画面如图1所示。每个业务办理人员也可以实时看到包括工作人员在内的其它所有人员,画面如图2所示。
[0004]现有技术的缺点是:1.工作人员看到的所有业务办理人员音视频画面位置是固定的如果某一个业务办理人员有问题通过语音讲述给工作人员,工作人员很难清楚知晓是哪一个业务办理人员在发言。2.在线音视频业务流程在办理的过程中,业务流程分为多个环节,每个环节可能需要响应的人来做应答,比如一笔贷款,就需要主贷款人、担保人(若干个)同时在框,目前的方案为,银行工作人员看到的画面中,处于中央画面的人,是工作人员手动拖进来放大的,如果工作人员忘记了拖动或者拖动错误,就会导致当前环节需要配合的人(主贷款人或者担保人)的画面没有处于中央位置被放大,从而影响沟通的效率和业务办理的有效性。
[0005]因此,需要一种音视频会话优化方法。

技术实现思路

[0006]本专利技术要解决的问题包括如何实现音视频会话过程中发言的业务人员的自动识别,并将发言的业务人员的视频窗口自动移至屏幕中的主视频窗口处。
[0007]为了解决上述诸如如何实现音视频会话过程中发言的业务人员的自动识别,并将发言的业务人员的视频窗口自动移至屏幕中的主视频窗口处的技术问题,提出了本专利技术。本专利技术的实施例提供了一种音视频会话优化方法、装置及存储介质。
[0008]根据本专利技术实施例的另一个方面,提供了一种音视频会话优化方法,所述方法包括:
[0009]确定处于发言状态的目标对象,并获取与所述目标对象对应的目标视频窗口;
[0010]判断所述目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致;
[0011]当所述目标对象与所述中心对象不一致时,将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域,同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。
[0012]可选地,其中所述确定处于发言状态的目标对象,包括:
[0013]确定当前的业务节点,根据业务节点和角色的关联关系匹配与所述当前的业务节点对应的角色,根据与所述当前的业务节点对应的角色确定所述处于发言状态的目标对象。
[0014]可选地,其中所述方法还包括:
[0015]将业务流程切分为至少一个业务节点,并配置与每个业务节点对应的角色,建立所述业务节点和角色的关联关系。
[0016]可选地,其中所述方法还包括:
[0017]当一个业务节点对应多个角色时,进行人声监测,并响应于接收到工作人员输入的第一语音数据,对所述第一语音数据进行语音识别,获取识别结果;
[0018]根据所述识别结果确定处于发言状态的目标对象。
[0019]可选地,其中所述方法还包括:
[0020]基于NLP自然语言处理技术对所述语音数据进行语音识别,获取识别结果。
[0021]可选地,其中所述确定处于发言状态的目标对象,包括:
[0022]在业务办理过程中,实时地进行语音监测;
[0023]当监测到第二语音数据时,对所述第二语音数据进行声纹检测,并根据声纹检测结果确定处于发言状态的目标对象。
[0024]可选地,其中所述方法还包括:
[0025]对获取到的语音数据进行去噪处理。
[0026]根据本专利技术实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上所述的方法。
[0027]根据本专利技术实施例的又一个方面,提供了一种音视频会话优化装置,所述装置包括:
[0028]目标对象确模块,用于确定处于发言状态的目标对象,并获取与所述目标对象对应的目标视频窗口;
[0029]判断模块,用于判断所述目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致;
[0030]视频窗口调换模块,用于当所述目标对象与所述中心对象不一致时,将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域,同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。
[0031]根据本专利技术实施例的又一个方面,提供了一种音视频会话优化装置,所述装置包括:
[0032]处理器;以及
[0033]存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
[0034]确定处于发言状态的目标对象,并获取与所述目标对象对应的目标视频窗口;
[0035]判断所述目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致;
[0036]当所述目标对象与所述中心对象不一致时,将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域,同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。
[0037]本专利技术实施例提供了一种音视频会话优化方法、装置及存储介质,可以确定处于发言状态的目标对象,并获取与所述目标对象对应的目标视频窗口;判断所述目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致;当所述目标对象与所述中心对象不一致时,将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域,同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。本专利技术的方法能够在视频在线业务办理的过程中,降低工作人员操作的复杂度,不再频繁的选中、切换业务节点对应的角色人的视窗,而使工作人员专注于要办理的业务本身;能够使当前对应节点的对应双方能够快速进入对方注视范围,进行有效的沟通;参与办理的人员中途有疑问和临时有事说明,能够第一时间被工作人员关注和应答,提高了业务办理效率。
[0038]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0039]通过参考下面的附图,可以更为完整地理解本专利技术的示例性实施方式:
[0040]图1是现有的多人视频会话中工作人员的视频页面的示意图;
[0041]图2是现有的多人视频会话中每个业务办理人员的视频页面的示意图;
[0042]图3是用于实现根据本专利技术实施例1所述的方法的计算机终端(或移动设备)的硬件结构框图;
[0043]图4是根据本专利技术实施例1的第一个方面所述的音视频会话优化方法 200的流程图;
[0044]图5为根据本专利技术实施例1的音视频会话优化的示意图;
[0045]图6是根据本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音视频会话优化方法,其特征在于,所述方法包括:确定处于发言状态的目标对象,并获取与所述目标对象对应的目标视频窗口;判断所述目标对象与当前处于屏幕的主视频窗口区域的主视频窗口对应的中心对象是否一致;当所述目标对象与所述中心对象不一致时,将所述目标对象对应的目标视频窗口移至屏幕的主视频窗口区域,同时将当前处于屏幕的主视频窗口区域的主视频窗口移至所述屏幕的视频窗口列表区域。2.根据权利要求1所述的方法,其特征在于,所述确定处于发言状态的目标对象,包括:确定当前的业务节点,根据业务节点和角色的关联关系匹配与所述当前的业务节点对应的角色,根据与所述当前的业务节点对应的角色确定所述处于发言状态的目标对象。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:将业务流程切分为至少一个业务节点,并配置与每个业务节点对应的角色,建立所述业务节点和角色的关联关系。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:当一个业务节点对应多个角色时,进行人声监测,并响应于接收到工作人员输入的第一语音数据,对所述第一语音数据进行语音识别,获取识别结果;根据所述识别结果确定处于发言状态的目标对象。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:基于NLP自然语言处理技术对所述语音数据进行语音识别,获取识别结果。6.根据权利要求1所述的方法,其特征在于,所述确定处于发言状态的目标对象,包括:在业务办理过程中,实时地进行语音监测;当...

【专利技术属性】
技术研发人员:宁世杰夏溧刘涛
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1