内容编目方法、装置和电子设备制造方法及图纸

技术编号:28213168 阅读:12 留言:0更新日期:2021-04-24 14:52
本公开实施例公开了一种内容编目方法、装置、电子设备和计算机可读存储介质。其中该内容编目方法包括:获取待编目音频;对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴;对所述文本内容进行语义分析得到文本内容的编目结果;其中,编目结果表示所述文本内容被划分为预设的格式的文本;将所述时间轴与所述编目结果进行对应得到带时间轴的编目结果。上述方法通过对音频内容进行语义分析得到带有时间轴的编目结果,解决了现有技术中用户无法在音视频中快速定位的技术问题。频中快速定位的技术问题。频中快速定位的技术问题。

【技术实现步骤摘要】
内容编目方法、装置和电子设备


[0001]本公开涉及语音处理领域,尤其涉及一种内容编目方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着互联网信息技术的进步,从图片、文字到视频,内容创作与分享的升维加速正在进行。当前的视频内容一方面依靠视频标题、标签、播放热度等吸引用户流量,另一方面,视频平台对视频标题、标签、用户画像等建立推荐系统来引流,言而总之,对于视频内容本身的利用还处于浅层次阶段。
[0003]对于视频内容的分析,有基于视频帧图像转文字的,如image2text,其主要面向于帧图像的场景识别与理解、目标的检测和识别、图像融合等;有基于图像文字识别的,如OCR;而基于视频语音内容识别的方案较少,且场景相对有限。
[0004]在某些场景下,用户对音视频内容信息深度利用需求较为迫切,如线上教育、线上会议、演讲、节目主持等,要求实时字幕、内容摘要、章节整理等;在线上教育平台,课程视频时常一般在45分钟左右不等并且涉及到不同知识点,用户希望快速定位到感兴趣的内容章节。

技术实现思路

[0005]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0006]为了解决上述技术问题,第一方面,本公开实施例提供一种内容编目方法,包括:
[0007]获取待编目音频;
[0008]对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴;
[0009]对所述文本内容进行语义分析得到文本内容的编目结果;其中,编目结果表示所述文本内容被划分为预设的格式的文本;
[0010]将所述时间轴与所述编目结果进行对应得到带时间轴的编目结果。
[0011]进一步的,所述获取待编目音频,包括:
[0012]获取待编目视频;
[0013]获取所述待编目视频中的待编目音频。
[0014]进一步的,所述对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴,包括:
[0015]对所述待编目音频进行语音识别得到所述待编目音频中的分句文本以及每一个分句所对应的时间轴。
[0016]进一步的,所述对所述文本内容进行语义分析得到文本内容的编目结果,包括:
[0017]将所述分句文本进行段落划分得到至少一个文本段落;
[0018]生成所述文本段落的标题,其中所述标题以所述文本段落中的关键词表示。
[0019]进一步的,所述将所述分句文本进行段落划分得到至少一个文本段落,包括:
[0020]将所述分句文本按照其时间轴排序得到分句文本序列;
[0021]分析所述分句文本序列中的每一个分句文本与其前后的分句文本的语义关联关系;
[0022]根据所述语义关联关系将至少一个分句文本划分为一个文本段落。
[0023]进一步的,所述分析所述分句文本序列中的每一个分句文本与其前后的分句文本的语义关联关系,包括:
[0024]设置分析窗口大小,所述窗口大小为奇数;
[0025]在所述分句文本序列中移动所述分析窗口得到待分析的分句文本集合;
[0026]对所述分句文本集合中的分句文本进行分析,得到所述窗口的中间分句文本与所述窗口中的其他位置的分句文本的关联关系。
[0027]进一步的,所述根据所述语义关联关系将至少一个分句文本划分为一个文本段落,包括:
[0028]如果分句文本与其前边的分句文本和/或后边的分句文本语义关联,则将所述分句文本、所述分句文本前边的分句文本和所述分句文本后边的分句文本划分在同一个文本段落;
[0029]如果所述分句文本与其前边的分句文本和后边的分句文本均无语义关联,则将所述分句文本划分为一个文本段落。
[0030]进一步的,所述生成所述文本段落的标题,包括:
[0031]在所述文本段落中检测第一次出现所述标题的关键词的位置以及关键词的内容,其中所述关键词的位置用关键词首位两个字在所述文本段落中的位置表示,所述关键词的内容为所述首位两个字中间的内容。
[0032]进一步的,所述将所述时间轴与所述编目结果进行对应得到带时间轴的编目结果,包括:
[0033]获取所述文本段落中的分句文本的时间轴中的最小时间点和最大时间点;
[0034]根据所述最小时间点和最大时间点生成所述文本段落的时间轴。
[0035]进一步的,所述方法还包括:
[0036]将所述带时间轴的编目结果以预设格式显示。
[0037]第二方面,本公开实施例提供一种内容编目装置,包括:
[0038]音频获取模块,用于获取待编目音频;
[0039]转写模块,用于对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴;
[0040]编目模块,用于对所述文本结果进行语义分析得到文本内容的编目结果;其中,编目结果表示文本内容被划分为预设的格式;将所述时间轴与所述编目结果进行对应得到带时间轴的编目结果。
[0041]进一步的,所述音频获取模块,还用于:
[0042]获取待编目视频;
[0043]获取所述待编目视频中的待编目音频。
[0044]进一步的,所述转写模块,还用于:
[0045]对所述待编目音频进行语音识别得到所述待编目音频中的分句文本以及每一个分句所对应的时间轴。
[0046]进一步的,所述编目模块,还用于:
[0047]将所述分句文本进行段落划分得到至少一个文本段落;
[0048]生成所述文本段落的标题,其中所述标题以所述文本段落中的关键词表示。
[0049]进一步的,所述编目模块,还用于:
[0050]将所述分句文本按照其时间轴排序得到分句文本序列;
[0051]分析所述分句文本序列中的每一个分句文本与其前后的分句文本的语义关联关系;
[0052]根据所述语义关联关系将至少一个分句文本划分为一个文本段落。
[0053]进一步的,所述编目模块,还用于:
[0054]设置分析窗口大小,所述窗口大小为奇数;
[0055]在所述分句文本序列中移动所述分析窗口得到待分析的分句文本集合;
[0056]对所述分句文本集合中的分句文本进行分析,得到所述窗口的中间分句文本与所述窗口中的其他位置的分句文本的关联关系。
[0057]进一步的,所述编目模块,还用于:
[0058]如果分句文本与其前边的分句文本和/或后边的分句文本语义关联,则将所述分句文本、所述分句文本前边的分句文本和所述分句文本后边的分句文本划分在同一个文本段落;
[0059]如果所述分句文本与其前边的分句文本和后边的分句文本均无语义关联,则将所述分句文本划分为一个文本段落。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容编目方法,其特征在于,包括:获取待编目音频;对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴;对所述文本内容进行语义分析得到文本内容的编目结果;其中,编目结果表示所述文本内容被划分为预设的格式的文本;将所述时间轴与所述编目结果进行对应得到带时间轴的编目结果。2.如权利要求1所述的内容编目方法,其特征在于,所述获取待编目音频,包括:获取待编目视频;获取所述待编目视频中的待编目音频。3.如权利要求1或2中任一项所述的内容编目方法,其特征在于,所述对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴,包括:对所述待编目音频进行语音识别得到所述待编目音频中的分句文本以及每一个分句所对应的时间轴。4.如权利要求3所述的内容编目方法,其特征在于,所述对所述文本内容进行语义分析得到文本内容的编目结果,包括:将所述分句文本进行段落划分得到至少一个文本段落;生成所述文本段落的标题,其中所述标题以所述文本段落中的关键词表示。5.如权利要求4所述的内容编目方法,其特征在于,所述将所述分句文本进行段落划分得到至少一个文本段落,包括:将所述分句文本按照其时间轴排序得到分句文本序列;分析所述分句文本序列中的每一个分句文本与其前后的分句文本的语义关联关系;根据所述语义关联关系将至少一个分句文本划分为一个文本段落。6.如权利要求5所述的内容编目方法,其特征在于,所述分析所述分句文本序列中的每一个分句文本与其前后的分句文本的语义关联关系,包括:设置分析窗口大小,所述窗口大小为奇数;在所述分句文本序列中移动所述分析窗口得到待分析的分句文本集合;对所述分句文本集合中的分句文本进行分析,得到所述窗口的中间分句文本与所述窗口中的其他位置的分句文本的关联关系。7.如权利要求5所述的内容编目方法,其特征在于,所述根据所述语义关联关系将至少一个分句文本划分为一...

【专利技术属性】
技术研发人员:陈孝良赵昂叶森冯大航
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1