一种智能视频会议系统及方法技术方案

技术编号:30884840 阅读:14 留言:0更新日期:2021-11-22 20:26
本发明专利技术公开了一种智能视频会议系统及方法,涉及视频会议技术领域,所述系统包括:声音信息分析单元,用于获取视频会议中预定的声音信息,对所述声音信息进行分析;声音数据获取单元,根据所述声音信息的分析结果对声音信息进行筛选,并获取包含预定词汇的声音数据;所述声音分析单元对所述声音信息进行分析的方法为:采集由用户所发出的输入声音信息;根据存储声音信息的识别词典,对声音信息执行初次声音识别,以产生输入声音信息的声音特征指定的初次声音识别结果;具有智能化程度高和使用方便的优点。方便的优点。方便的优点。

【技术实现步骤摘要】
一种智能视频会议系统及方法


[0001]本专利技术涉及视频会议
,特别是涉及一种智能视频会议系统及方法。

技术介绍

[0002]视频会议,是指位于两个或多个地点的人们,通过通信设备和网络,进行面对面交谈的会议。根据参会地点数目不同,视频会议可分为点对点会议和多点会议。日常生活中的个人,对谈话内容安全性、会议质量、会议规模没有要求,可以采用如腾讯QQ这样的视频软件来进行视频聊天。而政府机关、企业事业单位的商务视频会议,要求有稳定安全的网络、可靠的会议质量、正式的会议环境等条件,则需要使用专业的视频会议设备,组建专门的视频会议系统。由于这样的视频会议系统都要用到电视来显示,也被称为电视会议、视讯会议。
[0003]使用视频会议系统,参会者可以听到其它会场的声音、看到其它会场现场参会人的形象、动作和表情,还可以发送电子演示内容,使与会者有身临其境的感觉。
[0004]随着中国信息通信网络的持续快速建设,中国通信水平已经大幅度提高,为各行各业的信息交流提供了可靠的保证。在诸多通信业务中,会议电视业务越来越表现出良好的发展势头。
[0005]会议电视是利用电视技术和设备,通过通信网络召开会议的一种多媒体通信方式。在召开电视会议时,处于两地或多个不同地点的与会代表,既可以听到对方的声音,又能看到对方的形象,同时还能看到对方会议室的场景以及在会议中展示的实物、图片、表格、文件等,“缩短”了与会代表的距离,增强了会议的气氛,使大家就像在同一处参加会议,显著提高工作效率。
[0006]中国公众会议电视业务是通过公众会议电视骨干网实现的。公众会议电视骨干网由会议电视终端设备(含编解码器)、数字信道(光缆、卫星)、多点控制设备(MCU)组成。由此可见,会议电视系统由会场和通信传输信道组成。会议电视系统的会场通常分为主会场和分会场,主会场为会议电视系统的控制中心,主要的控制设备、图像或声音的分配及切换设备均配置在主会场。会议电视系统的通信传输信道通常采用光缆(称为地面会议电视系统)、卫星(称为卫星会议电视系统)及光缆和卫星信道并用(称为混合型会议电视系统)。其主要作用是将主会场的实况视频信号、语音信号及用户的数据信号进行采集、压缩编码、多路复用后送到信道上。同时,将从信道接收到的会议电视信号进行多路分解、视音频解码,还原成分会场的视频、音频信号及数据信号。

技术实现思路

[0007]鉴于此,本专利技术的目的是提供一种智能视频会议系统及方法,具有智能化程度高和使用方便的优点。
[0008]为了实现上述目的,本专利技术采用如下技术方案:
[0009]一种智能视频会议系统,所述系统包括:声音信息分析单元,用于获取视频会议中
预定的声音信息,对所述声音信息进行分析;声音数据获取单元,根据所述声音信息的分析结果对声音信息进行筛选,并获取包含预定词汇的声音数据;所述声音分析单元对所述声音信息进行分析的方法为:采集由用户所发出的输入声音信息;根据存储声音信息的识别词典,对声音信息执行初次声音识别,以产生输入声音信息的声音特征指定的初次声音识别结果;决定接受还是拒绝由声音特征指定的初次声音识别结果;当拒绝由声音特征指定的初次声音识别结果时,执行二次声音识别;接收二次声音识别结果;向声音识别系统外部输出初次声音识别结果或二次声音识别结果;响应于向声音信息分析单元外部输出的初次声音识别结果或二次声音识别结果,输入确定信息;以及根据输入的确定信息,更新识别词典;所述系统还包括:手势情况分析单元,用于获取视频会议中预定的手势情况,对所述手势情况进行分析;运动轨迹获取单元,用于根据所述手势情况的分析结果获取所述手势的运动轨迹;图像嵌入单元,用于根据所述声音数据和/或运动轨迹获取相应的图像,并将该图像嵌入到视频会议的视频流中;该图像为所述视频会议中发言人在某段时间内声音数据和/或手势比划时运动轨迹相对应的图案;根据所述声音数据和/或运动轨迹获取相应的图像,包括:根据手势比划时运动轨迹得到相应的图像轮廓,根据所述声音数据修正所述图像轮廓。
[0010]进一步的,所述更新识别词典的所述更新步骤包括如下步骤:当识别词典中的单词数量超过声音信息分析单元的处理能力时,根据过去确定信息的顺序和过去确定信息的频率中至少之一,删除单词。
[0011]进一步的,所述手势情况分析单元包括:视频流解析单元,用于获取视频会议中预定的手势情况后,将手势情况的视频流解析成若干帧的图像;图像标记时间标签单元,用于根据视频的帧率给各帧图像打上时间标签;图像分析单元,用于根据所述时间标签对所述各帧图像进行分片,对各时间分片的图像进行分析;手势信息获取单元,根据所述对各时间分片的图像进行分析的分析结果获取各时间片内的手势信息。
[0012]进一步的,该视频会议系统还包括:声音数据标记时间标签单元,用于将所述包含预定词汇的声音数据打上时间标签;同步单元,用于根据所述声音数据的时间标签及各帧图像的时间标签将声音数据与手势进行同步。
[0013]进一步的,所述图像嵌入单元包括:声音数据及运动轨迹分析单元,用于对所述声音数据及运动轨迹进行分析;判断单元,用于根据分析结果判断数据库中是否存在与该声音数据及运动轨迹相匹配的图像;图像生成单元,用于在所述判断单元的判断结果为否的情况下,根据所述手势的运动轨迹生成与手势的运动轨迹一致的图像。
[0014]一种智能视频会议方法,所述方法执行以下步骤:步骤1:声音信息分析单元,获取视频会议中预定的声音信息,对所述声音信息进行分析;步骤2:声音数据获取单元,根据所述声音信息的分析结果对声音信息进行筛选,并获取包含预定词汇的声音数据;步骤3:手势情况分析单元,获取视频会议中预定的手势情况,对所述手势情况进行分析;步骤4:运动轨迹获取单元,根据所述手势情况的分析结果获取所述手势的运动轨迹;步骤5:图像嵌入单元,根据所述声音数据和/或运动轨迹获取相应的图像,并将该图像嵌入到视频会议的视频流中;该图像为所述视频会议中发言人在某段时间内声音数据和/或手势比划时运动轨迹相对应的图案;根据所述声音数据和/或运动轨迹获取相应的图像,包括:根据手势比划时运动轨迹得到相应的图像轮廓,根据所述声音数据修正所述图像轮廓。
[0015]进一步的,所述声音分析单元对所述声音信息进行分析的方法为:采集由用户所发出的输入声音信息;根据存储声音信息的识别词典,对声音信息执行初次声音识别,以产生输入声音信息的声音特征指定的初次声音识别结果;决定接受还是拒绝由声音特征指定的初次声音识别结果;当拒绝由声音特征指定的初次声音识别结果时,执行二次声音识别;接收二次声音识别结果;向声音识别系统外部输出初次声音识别结果或二次声音识别结果;响应于向声音信息分析单元外部输出的初次声音识别结果或二次声音识别结果,输入确定信息;以及根据输入的确定信息,更新识别词典。
[0016]进一步的,所述更新识别词典的所述更新步骤包括如下步骤:当识别词典中的单词数量超过声音信息分析单元的处理能力时,根据过去确定信息的顺序和过去确定信息的频率中至少之一,删本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能视频会议系统,其特征在于,所述系统包括:声音信息分析单元,用于获取视频会议中预定的声音信息,对所述声音信息进行分析;声音数据获取单元,根据所述声音信息的分析结果对声音信息进行筛选,并获取包含预定词汇的声音数据;所述声音分析单元对所述声音信息进行分析的方法为:采集由用户所发出的输入声音信息;根据存储声音信息的识别词典,对声音信息执行初次声音识别,以产生输入声音信息的声音特征指定的初次声音识别结果;决定接受还是拒绝由声音特征指定的初次声音识别结果;当拒绝由声音特征指定的初次声音识别结果时,执行二次声音识别;接收二次声音识别结果;向声音识别系统外部输出初次声音识别结果或二次声音识别结果;响应于向声音信息分析单元外部输出的初次声音识别结果或二次声音识别结果,输入确定信息;以及根据输入的确定信息,更新识别词典;所述系统还包括:手势情况分析单元,用于获取视频会议中预定的手势情况,对所述手势情况进行分析;运动轨迹获取单元,用于根据所述手势情况的分析结果获取所述手势的运动轨迹;图像嵌入单元,用于根据所述声音数据和/或运动轨迹获取相应的图像,并将该图像嵌入到视频会议的视频流中;该图像为所述视频会议中发言人在某段时间内声音数据和/或手势比划时运动轨迹相对应的图案;根据所述声音数据和/或运动轨迹获取相应的图像,包括:根据手势比划时运动轨迹得到相应的图像轮廓,根据所述声音数据修正所述图像轮廓。2.如权利要求1所述的系统,其特征在于,所述更新识别词典的所述更新步骤包括如下步骤:当识别词典中的单词数量超过声音信息分析单元的处理能力时,根据过去确定信息的顺序和过去确定信息的频率中至少之一,删除单词。3.如权利要求2所述的系统,其特征在于,所述手势情况分析单元包括:视频流解析单元,用于获取视频会议中预定的手势情况后,将手势情况的视频流解析成若干帧的图像;图像标记时间标签单元,用于根据视频的帧率给各帧图像打上时间标签;图像分析单元,用于根据所述时间标签对所述各帧图像进行分片,对各时间分片的图像进行分析;手势信息获取单元,根据所述对各时间分片的图像进行分析的分析结果获取各时间片内的手势信息。4.如权利要求3所述的系统,其特征在于,该视频会议系统还包括:声音数据标记时间标签单元,用于将所述包含预定词汇的声音数据打上时间标...

【专利技术属性】
技术研发人员:陈东
申请(专利权)人:上海熔光信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1