内容编目方法、装置和电子设备制造方法及图纸

技术编号：28213168 阅读：12 留言：0更新日期：2021-04-24 14:52

本公开实施例公开了一种内容编目方法、装置、电子设备和计算机可读存储介质。其中该内容编目方法包括：获取待编目音频；对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴；对所述文本内容进行语义分析得到文本内容的编目结果；其中，编目结果表示所述文本内容被划分为预设的格式的文本；将所述时间轴与所述编目结果进行对应得到带时间轴的编目结果。上述方法通过对音频内容进行语义分析得到带有时间轴的编目结果，解决了现有技术中用户无法在音视频中快速定位的技术问题。频中快速定位的技术问题。频中快速定位的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
内容编目方法、装置和电子设备

[0001]本公开涉及语音处理领域，尤其涉及一种内容编目方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着互联网信息技术的进步，从图片、文字到视频，内容创作与分享的升维加速正在进行。当前的视频内容一方面依靠视频标题、标签、播放热度等吸引用户流量，另一方面，视频平台对视频标题、标签、用户画像等建立推荐系统来引流，言而总之，对于视频内容本身的利用还处于浅层次阶段。
[0003]对于视频内容的分析，有基于视频帧图像转文字的，如image2text，其主要面向于帧图像的场景识别与理解、目标的检测和识别、图像融合等；有基于图像文字识别的，如OCR；而基于视频语音内容识别的方案较少，且场景相对有限。
[0004]在某些场景下，用户对音视频内容信息深度利用需求较为迫切，如线上教育、线上会议、演讲、节目主持等，要求实时字幕、内容摘要、章节整理等；在线上教育平台，课程视频时常一般在45分钟左右不等并且涉及到不同知识点，用户希望快速定位到感兴趣的内容章节。

技术实现思路

[0005]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0006]为了解决上述技术问题，第一方面，本公开实施例提供一种内容编目方法，包括：
[0007]获取待编目音频；
[0008]对所述待编目音频...

【技术保护点】

【技术特征摘要】
1.一种内容编目方法，其特征在于，包括：获取待编目音频；对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴；对所述文本内容进行语义分析得到文本内容的编目结果；其中，编目结果表示所述文本内容被划分为预设的格式的文本；将所述时间轴与所述编目结果进行对应得到带时间轴的编目结果。2.如权利要求1所述的内容编目方法，其特征在于，所述获取待编目音频，包括：获取待编目视频；获取所述待编目视频中的待编目音频。3.如权利要求1或2中任一项所述的内容编目方法，其特征在于，所述对所述待编目音频进行识别转写得到所述待编目音频的文本内容以及所述文本内容对应的时间轴，包括：对所述待编目音频进行语音识别得到所述待编目音频中的分句文本以及每一个分句所对应的时间轴。4.如权利要求3所述的内容编目方法，其特征在于，所述对所述文本内容进行语义分析得到文本内容的编目结果，包括：将所述分句文本进行段落划分得到至少一个文本段落；生成所述文本段落的标题，其中所述标题以所述文本段落中的关键词表示。5.如权利要求4所述的内容编目方法，其特征在于，所述将所述分句文本进行段落划分得到至少一个文本段落，包括：将所述分句文本按照其时间轴排序得到分句文本序列；分析所述分句文本序列中的每一个分句文本与其前后的分句文本的语义关联关系；根据所述语义关联关系将至少一个分句文本划分为一个文本段落。6.如权利要求5所述的内容编目方法，其特征在于，所述分析所述分句文本序列中的每一个分句文本与其前后的分句文本的语义关联关系，包括：设置分析窗口大小，所述窗口大小为奇数；在所述分句文本序列中移动所述分析窗口得到待分析的分句文本集合；对所述分句文本集合中的分句文本进行分析，得到所述窗口的中间分句文本与所述窗口中的其他位置的分句文本的关联关系。7.如权利要求5所述的内容编目方法，其特征在于，所述根据所述语义关联关系将至少一个分句文本划分为一...

【专利技术属性】
技术研发人员：陈孝良，赵昂，叶森，冯大航，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人