【技术实现步骤摘要】
音视频摘要提取方法、装置、设备及存储介质
[0001]本申请涉及人工智能的
,尤其涉及一种音视频摘要提取方法、装置、设备及存储介质。
技术介绍
[0002]当前,用户可以通过查看音视频对应的音视频摘要,来在短时间内获知音视频的核心内容。而现有技术中,通常通过人工的方式去进行音视频摘要提取,基于人工提取的方法提取内容虽然准确,但这种方式需要人工看完整段音视频后,才能基于音视频内容给出摘要结果。现急需一种方法来实现音视频摘要的智能提取。
技术实现思路
[0003]本申请的主要目的在于提供一种音视频摘要提取方法、装置、设备及存储介质,旨在实现对音视频摘要的智能提取。
[0004]第一方面,本申请提供一种音视频摘要提取方法,包括:
[0005]获取待处理音视频,所述待处理音视频包括视频帧集以及音频信息,且所述待处理音视频为第一用户拜访第二用户,以对所述第二用户讲解演示文稿的音视频;
[0006]按照预设步长和预设切割长度将所述音频信息切割成若干个音频片段,其中,所述预设步长小于所述预设切割长度;
[0007]利用预设的人声识别模型对各个所述音频片段进行分析,以从各个所述音频片段中筛选人声片段;
[0008]提取各个所述人声片段的语音特征,并根据所述语音特征对各个所述人声片段进行分组后按时间顺序进行存储,得到第一人声片段集以及第二人声片段集;
[0009]对所述第一人声片段集中的所述人声片段进行拼接,得到第一用户音频,并对所述第二人声片段集中的所述人声片段进 ...
【技术保护点】
【技术特征摘要】
1.一种音视频摘要提取方法,其特征在于,包括:获取待处理音视频,所述待处理音视频包括视频帧集以及音频信息,且所述待处理音视频为第一用户拜访第二用户,以对所述第二用户讲解演示文稿的音视频;按照预设步长和预设切割长度将所述音频信息切割成若干个音频片段,其中,所述预设步长小于所述预设切割长度;利用预设的人声识别模型对各个所述音频片段进行分析,以从各个所述音频片段中筛选人声片段;提取各个所述人声片段的语音特征,并根据所述语音特征对各个所述人声片段进行分组后按时间顺序进行存储,得到第一人声片段集以及第二人声片段集;对所述第一人声片段集中的所述人声片段进行拼接,得到第一用户音频,并对所述第二人声片段集中的所述人声片段进行拼接,得到第二用户音频;对所述第一用户音频进行关键词提取,得到第一关键词集,并对所述第二用户音频进行关键词提取,得到第二关键词集;根据所述第一关键词集以及所述第二关键词集从所述视频帧集中筛选关键视频帧,并根据各个所述关键视频帧生成视频摘要。2.根据权利要求1所述的方法,其特征在于,所述对所述第一用户音频进行关键词提取,得到第一关键词集,包括:对所述第一用户音频进行语音识别,得到所述第一用户音频对应的文字信息;对所述文字信息进行分词处理,得到第一词集;利用预设的无用词滤除模型滤除所述第一词集中的无用词,得到第二词集;计算所述第二词集中各个第二词语的词频,并根据计算得到的词频结果设置各个所述第二词语的权重;根据各个所述第二词语的权重从所述第二词集中筛选关键词,得到第一关键词集。3.根据权利要求1
‑
2中任一项所述的方法,其特征在于,所述根据所述第一关键词集以及所述第二关键词集从所述视频帧集中筛选关键视频帧,包括:滤除所述视频帧集中的重复视频帧以及无用视频帧,得到目标视频帧集;提取所述目标视频帧集中各个目标视频帧的文字特征;根据所述第一关键词词集以及所述文字特征,计算各个所述目标视频帧的第一得分;根据所述第二关键词词集以及所述文字特征,计算各个所述目标视频帧的第二得分;根据所述第一得分以及所述第二得分,计算各个所述目标视频帧的综合得分;根据所述综合得分从所述目标视频帧集中筛选关键视频帧。4.根据权利要求3所述的方法,其特征在于,所述滤除所述视频帧集中的重复视频帧以及无用视频帧,得到目标视频帧集,包括:逐个获取所述视频帧集中的视频帧,得到第一视频帧;将所述第一视频帧与所述视频帧集中的比对视频帧进行比对,得到所述第一视频帧与所述比对视频帧的比对相似度,其中,所述比对视频帧为所述视频帧集中除所述第一视频帧之外的视频帧;当所述比对相似度大于预设值时,确定所述比对视频帧为重复视频帧,将所述比对视频帧从所述视频帧集中移除;
当所述视频帧集中的所有所述重复视频帧均被移除时,滤除所述视频帧集中的无用视频帧,得到目标视频帧集。5.根据权利要求4所述的方法,其特征在于,所述滤除所述视频帧集中的无用视频帧,得到目标视频帧集,包括:逐个获取所述视频帧集中的视频帧,得到第二视频帧;获取所...
【专利技术属性】
技术研发人员:刘钊,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。