音视频数据处理方法和装置、电子设备及存储介质制造方法及图纸

技术编号:38546473 阅读:11 留言:0更新日期:2023-08-22 20:55
本申请实施例提供了一种音视频数据处理方法和装置、电子设备及存储介质,属于金融科技技术领域。该方法包括:从预先录制的原始音视频数据提取音频数据;对所述音频数据进行语音内容识别,得到文本数据;其中,所述文本数据包括文本片段;对所述文本数据进行主题划分处理,得到章节主题;根据所述章节主题从所述文本片段中提取出选定文本片段;根据所述选定文本片段的起始时间对所述原始音视频数据进行视频段提取,得到选定音视频段数据;根据所述章节主题、预设的环节标签信息对所述选定音视频段数据进行合并处理,得到目标音视频数据。本申请实施例能够节省音视频数据剪辑和总结的人力。的人力。的人力。

【技术实现步骤摘要】
音视频数据处理方法和装置、电子设备及存储介质


[0001]本申请涉及金融科技(Fintech)
,尤其涉及一种音视频数据处理方法和装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,互联网技术中线上会议成为保险行业会客的流行方式。通过保险销售员组织大型线上会客时,会设置多个环节环节,当会客结束后,需要专业的剪辑人员对线上会客过程中录制的音视频进行剪辑和总结,便于客户对每一次保险项目的线上会议进行回顾,以节省用户观看时长。但需要专业的剪辑人员对音视频数据中的精彩环节剪辑和总结,且剪辑人员需要观看完整视频以确定音视频数据中的精彩环节,需要耗费大量人力。因此,如何对音视频数据进行自动剪辑和总结,成为目前亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种音视频数据处理方法和装置、电子设备及存储介质,旨在自动对保险线上会客过程中的音视频数据进行剪辑和总结以构建目标音视频数据,节省人力。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种音视频数据处理方法,所述方法包括:
[0005]从预先录制的原始音视频数据提取音频数据;
[0006]对所述音频数据进行语音内容识别,得到文本数据;其中,所述文本数据包括文本片段;
[0007]对所述文本数据进行主题划分处理,得到章节主题;
[0008]根据所述章节主题从所述文本片段中提取出选定文本片段;
[0009]根据所述选定文本片段的起始时间对所述原始音视频数据进行视频段提取,得到选定音视频段数据;
[0010]根据所述章节主题、预设的环节标签信息对所述选定音视频段数据进行合并处理,得到目标音视频数据。
[0011]在一些实施例,所述对所述文本数据进行主题划分处理,得到章节主题,包括:
[0012]对所述文本片段进行关键词提取,得到文本关键词;
[0013]获取所述文本关键词在所述文本数据的出现次数,得到关键词总数量;
[0014]根据所述关键词总数量对所述文本关键词进行筛选处理,得到参考关键词;
[0015]对所述参考关键词和所述文本关键词进行相似度计算,得到词语相似度;
[0016]根据所述词语相似度对所述文本关键词进行聚类处理,得到目标关键词集合;其中,以所述参考关键词作为聚类中心;
[0017]根据所述目标关键词集合生成所述章节主题。
[0018]在一些实施例,所述对所述参考关键词和所述文本关键词进行相似度计算,得到
词语相似度,包括:
[0019]将所述参考关键词进行向量化处理,得到参考向量;
[0020]将所述文本关键词进行向量化处理,得到关键词向量;
[0021]对所述参考向量和所述关键词向量进行向量距离计算,得到所述词语相似度。
[0022]在一些实施例,所述根据所述章节主题从所述文本片段中提取出选定文本片段,包括:
[0023]获取所述文本关键词在所述文本片段的出现次数,得到关键词数量;
[0024]根据所述关键词数量对所述文本关键词进行筛选处理,得到每一所述文本片段的选定关键词;
[0025]对所述选定关键词和所述章节主题进行相似度计算,得到主题相似度;
[0026]根据所述主题相似度对所述文本片段进行筛选处理,得到所述选定文本片段。
[0027]在一些实施例,所述根据所述主题相似度对所述文本片段进行筛选处理,得到所述选定文本片段,包括:
[0028]获取所述主题相似度中的最大相似度;
[0029]将所述最大相似度的所述文本片段作为所述选定文本片段。
[0030]在一些实施例,所述根据所述章节主题、预设的环节标签信息对所述选定音视频段数据进行合并处理,得到目标音视频数据,包括:
[0031]根据所述章节主题对所述环节标签信息进行筛选处理,得到每一所述章节主题的目标标签信息;
[0032]根据所述章节主题将所述目标标签信息添加在所述选定音视频段数据,得到目标音视频段数据;
[0033]将所述目标音视频段数据进行合并处理,得到所述目标音视频数据。
[0034]在一些实施例,在所述根据所述章节主题、预设的环节标签信息对所述选定音视频段数据进行合并处理,得到目标音视频数据之后,所述方法还包括:
[0035]更新所述目标音视频数据,具体包括:
[0036]根据所述章节主题从预存的后台系统数据中提取关键数据;其中,所述后台系统数据实在所述原始音视频数据的录制过程中进行获取得到;
[0037]根据所述章节主题将所述关键数据插入所述目标音视频数据中,以更新所述目标音视频数据。
[0038]为实现上述目的,本申请实施例的第二方面提出了一种音视频数据处理装置,所述装置包括:
[0039]音频提取模块,用于从预先录制的原始音视频数据提取音频数据;
[0040]语音内容识别模块,用于对所述音频数据进行语音内容识别,得到文本数据;其中,所述文本数据包括文本片段;
[0041]主题划分模块,用于对所述文本数据进行主题划分处理,得到章节主题;
[0042]文本段提取模块,用于根据所述章节主题从所述文本片段中提取出选定文本片段;
[0043]视频段提取模块,用于根据所述选定文本片段的起始时间对所述原始音视频数据进行视频段提取,得到选定音视频段数据;
[0044]数据合并模块,用于根据所述章节主题、预设的环节标签信息对所述选定音视频段数据进行合并处理,得到目标音视频数据。
[0045]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。
[0046]为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。
[0047]本申请提出的音视频数据处理方法和装置、电子设备及存储介质,其通过提取原始音视频数据中的音频数据,并将音频数据进行语音内容识别得到文本数据,以根据文本数据确定章节主题,再选出每一章节主题对应的选定文本片段,且选定文本片段作为每一章节主题最具代表性的片段,在原始音视频数据中提取出与选定文本片段的起始时间对应的选定音视频段数据,则选定音视频段数据能够表征每一章节主题对应的精彩音视频片段,再根据章节主题、环节标签信息将选定音视频段数据合并成目标音视频数据,以实现自动音视频数据剪辑操作,以节省用户的剪辑操作,从而节省人力。因此,生成的目标音视频数据以会议总结方式呈现音视频,能够满足用户回顾保险线上会客过程中的精彩片段,提升保险项目服务过程中的用户体验感。
附图说明
[0048]图1是本申请实施例提供的音视频数据处理方法的流程图;
[0049]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音视频数据处理方法,其特征在于,所述方法包括:从预先录制的原始音视频数据提取音频数据;对所述音频数据进行语音内容识别,得到文本数据;其中,所述文本数据包括文本片段;对所述文本数据进行主题划分处理,得到章节主题;根据所述章节主题从所述文本片段中提取出选定文本片段;根据所述选定文本片段的起始时间对所述原始音视频数据进行视频段提取,得到选定音视频段数据;根据所述章节主题、预设的环节标签信息对所述选定音视频段数据进行合并处理,得到目标音视频数据。2.根据权利要求1所述的方法,其特征在于,所述对所述文本数据进行主题划分处理,得到章节主题,包括:对所述文本片段进行关键词提取,得到文本关键词;获取所述文本关键词在所述文本数据的出现次数,得到关键词总数量;根据所述关键词总数量对所述文本关键词进行筛选处理,得到参考关键词;对所述参考关键词和所述文本关键词进行相似度计算,得到词语相似度;根据所述词语相似度对所述文本关键词进行聚类处理,得到目标关键词集合;其中,以所述参考关键词作为聚类中心;根据所述目标关键词集合生成所述章节主题。3.根据权利要求2所述的方法,其特征在于,所述对所述参考关键词和所述文本关键词进行相似度计算,得到词语相似度,包括:将所述参考关键词进行向量化处理,得到参考向量;将所述文本关键词进行向量化处理,得到关键词向量;对所述参考向量和所述关键词向量进行向量距离计算,得到所述词语相似度。4.根据权利要求2所述的方法,其特征在于,所述根据所述章节主题从所述文本片段中提取出选定文本片段,包括:获取所述文本关键词在所述文本片段的出现次数,得到关键词数量;根据所述关键词数量对所述文本关键词进行筛选处理,得到每一所述文本片段的选定关键词;对所述选定关键词和所述章节主题进行相似度计算,得到主题相似度;根据所述主题相似度对所述文本片段进行筛选处理,得到所述选定文本片段。5.根据权利要求4所述的方法,其特征在于,所述根据所述主题相似度对所述文本片段进行筛选处理,得到所述选定文本片段,包括:获取所述主题相似度中的最大相似度;将所述最大...

【专利技术属性】
技术研发人员:满园园
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1