视频会议的字幕处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37643190 阅读:9 留言:0更新日期:2023-05-25 10:09
本发明专利技术实施例提供了视频会议的字幕处理方法、装置、电子设备和存储介质,该方法包括:在进行视频会议的过程中,接收视频会议服务器发送的视频数据和音频数据,确定音频数据对应的文本信息;确定文本信息中的目标信息;将文本信息作为字幕融合至视频数据中,并对文本信息设置字幕样式,其中,目标信息和文本信息中的其他词语设置不同字幕样式;播放视频数据对应的视频画面,并根据文本的字幕样式在视频画面中显示文本信息。从而使得会议中的用户不仅可以听到参会者的音频,还可以看到对应的字幕以及会议内容的重点词汇,解决了由于发言者说话不标准,或者语速过快等导致其他人无法正确理解其表达内容的问题,提升了会议质量。提升了会议质量。提升了会议质量。

【技术实现步骤摘要】
视频会议的字幕处理方法、装置、电子设备和存储介质


[0001]本专利技术涉及视频会议
,特别是涉及一种视频会议的字幕处理方法、一种视频会议的字幕处理装置、一种电子设备和一种计算机可读存储介质。

技术介绍

[0002]在传统的视联网会议中,通常有一个主席角色、一个发言人角色、以及众多的参会者,当主席或者发言人在发言时,其他参会者可以实时看到主席或者发言人的画面,以及听到主席或者发言人的声音。然而,由于发言者说话不标准,或者语速过快等问题,往往导致其他人无法听清楚其说话的内容。

技术实现思路

[0003]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频会议的字幕处理方法、一种视频会议的字幕处理装置、一种电子设备和一种计算机可读存储介质。
[0004]为了解决上述问题,本专利技术实施例公开了一种视频会议的字幕处理方法,应用于视频会议终端,所述视频会议终端与视频会议服务器通信连接,所述方法包括:
[0005]在进行视频会议的过程中,接收所述视频会议服务器发送的视频数据和音频数据,确定所述音频数据对应的文本信息;
[0006]确定所述文本信息中的目标信息;
[0007]将所述文本信息作为字幕融合至所述视频数据中,并对所述文本信息设置字幕样式,其中,所述目标信息和所述文本信息中的其他词语设置不同字幕样式;
[0008]播放所述视频数据对应的视频画面,并根据所述文本的字幕样式在所述视频画面中显示所述文本信息。
[0009]可选地,所述确定所述文本信息中的目标信息,包括:
[0010]从所述文本信息中提取目标词语或目标短语;
[0011]将所述目标词语或目标短语与预置关键词进行匹配;
[0012]若匹配成功,则确定所述目标词语或目标短语为目标信息。
[0013]可选地,还包括:
[0014]获取针对当前视频会议的预置关键词,所述预置关键词用于表征在文本信息作为字幕融合至所述视频数据中,提取所述目标信息以使所述目标信息区别于所述文本信息中的其他词语进行展示。
[0015]可选地,所述确定所述文本信息中的目标信息,包括:
[0016]统计所述文本信息重复出现的目标词语或目标短语;
[0017]若所述重复出现的目标词语或目标短语的出现频率大于所述预设频率阈值,则确定所述重复出现的目标词语或目标短语为高频词;
[0018]从所述文本信息中提取所述高频词,将所述高频词作为目标信息。
[0019]可选地,所述对所述文本信息设置字幕样式,包括:
[0020]按照音频数据不同的来源对所述文本信息设置不同的字幕样式;其中,所述字幕样式包括文字大小、字体格式、字体颜色。
[0021]可选地,所述对所述文本信息设置字幕样式,包括:
[0022]按照不同的所述目标信息对所述文本设置不同的字幕样式;其中,所述字幕样式包括文字大小、字体格式、字体颜色。
[0023]可选地,所述将所述文本信息作为字幕融合至所述视频数据中,包括:
[0024]将所述文本信息拆分为多个文本片段;
[0025]获取所述多个文本片段在所述音频数据中的时间戳,并根据所述时间戳设置所述多个文本片段的持续时长;
[0026]根据所述多个文本片段的持续时长段,将所述多个文本片段作为字幕融合至所述视频数据中。
[0027]本专利技术实施例还公开了一种视频会议的字幕处理装置,应用于视频会议终端,所述视频会议终端与视频会议服务器通信连接,所述装置包括:
[0028]接收模块,用于在进行视频会议的过程中,接收所述视频会议服务器发送的视频数据和音频数据,确定所述音频数据对应的文本信息;
[0029]确定模块,用于确定所述文本信息中的目标信息;
[0030]融合模块,用于将所述文本信息作为字幕融合至所述视频数据中,并对所述文本信息设置字幕样式,其中,所述目标信息和所述文本信息中的其他词语设置不同字幕样式;
[0031]播放模块,用于播放所述视频数据对应的视频画面,并根据所述文本的字幕样式在所述视频画面中显示所述文本信息。
[0032]可选地,所述确定模块,包括:
[0033]第一提取模块,用于从所述文本信息中提取目标词语或目标短语;
[0034]匹配模块,用于将所述目标词语或目标短语与预置关键词进行匹配;
[0035]第一确定子模块,用于若匹配成功,则确定所述目标词语或目标短语为目标信息。
[0036]可选地,还包括:
[0037]获取模块,用于获取针对当前视频会议的预置关键词,所述预置关键词用于表征在文本信息作为字幕融合至所述视频数据中,提取所述目标信息以使所述目标信息区别于所述文本信息中的其他词语进行展示。
[0038]可选地,所述确定模块,包括:
[0039]统计模块,用于统计所述文本信息重复出现的目标词语或目标短语;
[0040]第二确定子模块,用于若所述重复出现的目标词语或目标短语的出现频率大于所述预设频率阈值,则确定所述重复出现的目标词语或目标短语为高频词;
[0041]第二提取模块,用于从所述文本信息中提取所述高频词,将所述高频词作为目标信息。
[0042]可选地,所述融合模块,包括:
[0043]第一设置模块,用于按照音频数据不同的来源对所述文本信息设置不同的字幕样式;其中,所述字幕样式包括文字大小、字体格式、字体颜色。
[0044]可选地,所述融合模块,包括:
[0045]第二设置模块,用于按照不同的所述目标信息对所述文本设置不同的字幕样式;其中,所述字幕样式包括文字大小、字体格式、字体颜色。
[0046]可选地,所述所述融合模块,包括:
[0047]拆分模块,用于将所述文本信息拆分为多个文本片段;
[0048]第三设置模块,用于获取所述多个文本片段在所述音频数据中的时间戳,并根据所述时间戳设置所述多个文本片段的持续时长;
[0049]融合子模块,用于根据所述多个文本片段的持续时长段,将所述多个文本片段作为字幕融合至所述视频数据中。
[0050]本专利技术实施例还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的视频会议的字幕处理方法的步骤。
[0051]本专利技术实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述的视频会议的字幕处理方法的步骤。
[0052]本专利技术实施例包括以下优点:
[0053]在本专利技术实施例中,在进行视频会议的过程中,接收视频会议服务器发送的视频数据和音频数据,确定音频数据对应的文本信息;确定文本信息中的目标信息;将文本信息作为字幕融合至视频数据中,并对文本信息设置字幕样式,其中,目标信息和文本信息中的其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频会议的字幕处理方法,其特征在于,应用于视频会议终端,所述视频会议终端与视频会议服务器通信连接,所述方法包括:在进行视频会议的过程中,接收所述视频会议服务器发送的视频数据和音频数据,确定所述音频数据对应的文本信息;确定所述文本信息中的目标信息;将所述文本信息作为字幕融合至所述视频数据中,并对所述文本信息设置字幕样式,其中,所述目标信息和所述文本信息中的其他词语设置不同字幕样式;播放所述视频数据对应的视频画面,并根据所述文本的字幕样式在所述视频画面中显示所述文本信息。2.根据权利要求1所述的方法,其特征在于,所述确定所述文本信息中的目标信息,包括:从所述文本信息中提取目标词语或目标短语;将所述目标词语或目标短语与预置关键词进行匹配;若匹配成功,则确定所述目标词语或目标短语为目标信息。3.根据权利要求2所述的方法,其特征在于,还包括:获取针对当前视频会议的预置关键词,所述预置关键词用于表征在文本信息作为字幕融合至所述视频数据中,提取所述目标信息以使所述目标信息区别于所述文本信息中的其他词语进行展示。4.根据权利要求1所述的方法,其特征在于,所述确定所述文本信息中的目标信息,包括:统计所述文本信息重复出现的目标词语或目标短语;若所述重复出现的目标词语或目标短语的出现频率大于所述预设频率阈值,则确定所述重复出现的目标词语或目标短语为高频词;从所述文本信息中提取所述高频词,将所述高频词作为目标信息。5.根据权利要求1所述的方法,其特征在于,所述对所述文本信息设置字幕样式,包括:按照音频数据不同的来源对所述文本信息设置不同的字幕样式;其中,所述字幕样式包括文字大小、字体格式、字体颜色。6.根据权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:张美聪李阔杨春晖
申请(专利权)人:视联动力信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1