音视频数据处理方法、装置、设备和存储介质制造方法及图纸

技术编号:28623384 阅读:27 留言:0更新日期:2021-05-28 16:19
公开了一种音视频数据处理方法,涉及自然语言处理技术领域,具体涉及自然语言的语义理解。该方法包括:从音视频数据中提取文本信息;根据文本信息生成文本大纲和多个时间区间,文本大纲包括多级大纲条目,多个时间区间与多级大纲条目相关联;根据文本大纲和多个时间区间,生成针对音视频数据的展示字段;以及将展示字段添加到音视频数据中,以得到更新的音视频数据。还公开了一种音视频数据处理装置、设备和存储介质。

【技术实现步骤摘要】
音视频数据处理方法、装置、设备和存储介质
本公开涉及自然语言处理
,具体涉及自然语言的语义理解,尤其涉及一种音视频数据处理方法、装置、设备和存储介质。
技术介绍
通过消费音视频数据来获取信息是当今知识传播的一种主要途径。用户在收听音频或观看视频时,如果音频或视频的时长相对较短,则更容易快速定位到所需的音频或视频内容。但如果音频或视频的时长相对较长,则在有限的时间内,可能无法快速准确地定位到所需的音频或视频内容,这会给用户造成不好的体验。特别是随着音频或视频时长的增长,或者在音频或视频中存在大量用户不感兴趣的内容的情况下,用户的注意力和兴趣也会随之下降,从而中断继续消费的意图。
技术实现思路
本公开提供了一种音视频数据处理方法、装置、设备以及存储介质。根据本公开的一方面,提供了一种音视频数据处理方法,包括:从音视频数据中提取文本信息;根据所述文本信息生成文本大纲和多个时间区间,所述文本大纲包括多级大纲条目,所述多个时间区间与所述多级大纲条目相关联;根据所述文本大纲和所述多个时间区间,生成针本文档来自技高网...

【技术保护点】
1.一种音视频数据处理方法,包括:/n从音视频数据中提取文本信息;/n根据所述文本信息生成文本大纲和多个时间区间,所述文本大纲包括多级大纲条目,所述多个时间区间与所述多级大纲条目相关联;/n根据所述文本大纲和所述多个时间区间,生成针对所述音视频数据的展示字段;以及/n将所述展示字段添加到所述音视频数据中,以得到更新的音视频数据。/n

【技术特征摘要】
1.一种音视频数据处理方法,包括:
从音视频数据中提取文本信息;
根据所述文本信息生成文本大纲和多个时间区间,所述文本大纲包括多级大纲条目,所述多个时间区间与所述多级大纲条目相关联;
根据所述文本大纲和所述多个时间区间,生成针对所述音视频数据的展示字段;以及
将所述展示字段添加到所述音视频数据中,以得到更新的音视频数据。


2.根据权利要求1所述的方法,其中,根据所述文本信息生成文本大纲和多个时间区间包括:
将所述文本信息划分为多个第一文本段;
针对所述多个第一文本段中的每个第一文本段,生成第一文本段标题,作为一级大纲条目;
基于所述多个第一文本段构建文本段集合;
针对所述文本段集合中的每个第一文本段执行以下操作,直至所述文本段集合中的每个第一文本段的数据量均小于预设阈值:
将所述第一文本段的数据量与所述预设阈值进行比较;
在所述第一文本段的数据量大于或等于所述预设阈值的情况下:
将所述第一文本段划分为多个第二文本段;
针对所述多个第二文本段中的每个第二文本段,生成第二文本段标题,并将所述第二文本段标题作为由该第一文本段生成的第一文本段标题的次级大纲条目;以及
将所述多个第二文本段分别作为第一文本段添加到所述文本段集合中。


3.根据权利要求2所述的方法,其中,将所述第一文本段划分为多个第二文本段包括:
利用第一深度学习模型对所述第一文本段进行摘要提取,以得到摘要文本段;以及
利用第二深度学习模型对所述摘要文本段进行分段,以得到多个第二文本段。


4.根据权利要求2所述的方法,其中,根据所述文本信息生成文本大纲和多个时间区间还包括:
根据所述音视频数据,对所述文本信息所包括的每个文本语句的起始时刻和结束时刻进行标记;以及
根据所述文本信息所包括的每个文本语句的起始时刻和结束时刻确定所述时间区间。


5.根据权利要求4所述的方法,其中,根据所述文本信息所包括的每个文本语句的起始时刻和结束时刻确定所述时间区间包括:
在针对所述多个第一文本段中的每个第一文本段,生成第一文本段标题,作为一级大纲条目之后,
确定所述第一文本段中的第一个文本语句的起始时刻,作为与所述一级大纲条目关联的时间区间的起始时刻;以及
确定所述第一文本段中的最后一个文本语句的结束时刻,作为与所述一级大纲条目关联的时间区间的结束时刻。


6.根据权利要求5所述的方法,其中,根据所述文本信息所包括的每个文本语句的起始时刻和结束时刻确定所述时间区间还包括:
在针对所述多个第二文本段中的每个第二文本段,生成第二文本段标题,并将所述第二文本段标题作为由该第一文本段生成的第一文本段标题的次级大纲条目之后,
确定所述第二文本段中的第一个文本语句的起始时刻,作为与所述次级大纲条目关联的时间区间的起始时刻;以及
确定所述第二文本段中的最后一个文本语句...

【专利技术属性】
技术研发人员:张明月
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1