歌词提取方法、装置、系统及计算机可读存储介质制造方法及图纸

技术编号：32495536 阅读：38 留言：0更新日期：2022-03-02 10:03

本发明专利技术实施例公开了一种歌词提取方法、装置、系统及计算机可读存储介质。其中该方法包括：按预定时间间隔提取目标视频中的帧作为目标帧；识别当前目标帧的时间戳及当前目标帧的标准文本信息集；将标准文本信息集中的其一标准文本信息分别与当前聚类文本信息集中每个子集中的参照文本信息进行相似度计算，得到每个子集对应的文本相似度；根据文本相似度将标准文本信息集中的标准文本信息与当前聚类文本信息集中每个子集中的文本信息进行聚类，得到聚类完成的头部子集，将头部子集中的最优标准文本信息作为对应时间戳的歌词文本信息。本发明专利技术降低了生成歌词的冗余度，且提高了歌词提取效率。取效率。取效率。

全部详细技术资料下载

【技术实现步骤摘要】
歌词提取方法、装置、系统及计算机可读存储介质

[0001]本专利技术涉及数据处理领域，尤其涉及一种歌词提取方法、装置、系统及计算机可读存储介质。

技术介绍

[0002]在KTV环境中，许多含有字幕的MV视频不存在相应的歌词文本文件。其中，歌词文本文件中包含有演唱顺序的歌词信息。
[0003]传统的MV字幕识别方法，通常为对MV每帧进行帧提取，之后逐帧进行文本提取，这样会造成识别后的歌词文本中存在很多重复的歌词。另外，因为每个演唱着演唱一句歌词的时间长度不一致，会造成识别后的相同的歌词文本冗余。
[0004]针对现有技术中相同歌词文本信息冗余的问题，目前还没有一个有效的解决方式。

技术实现思路

[0005]为解决上述问题，本专利技术提供一种歌词提取方法、装置、系统及计算机可读存储介质，间隔提取视频帧，并对提取的视频帧进行文本提取，对提取到的所有文本信息进行文本聚类，得到具有相同文本信息的集合，再从每个集合中提取一个最优标准文本信息作为歌词文本文件中的歌词文本，并通过对应的时间戳得到含有演唱顺序的

【技术保护点】

【技术特征摘要】
1.一种歌词提取方法，其特征在于，包括：按预定时间间隔提取目标视频中的帧作为目标帧；识别当前目标帧的时间戳及当前目标帧的标准文本信息集；将所述标准文本信息集中的其一标准文本信息分别与当前聚类文本信息集中每个子集中的参照文本信息进行相似度计算，得到每个子集对应的文本相似度；当所述文本相似度不小于对应子集的第一预设相似度阈值时，将所述标准文本信息添加到所述对应子集中，得到最新聚类文本信息集；当所有所述文本相似度均小于对应子集的第一预设相似度阈值时，将所述标准文本信息作为最新子集的参照文本信息，删除所述当前聚类文本信息集中的头部子集，将所述最新子集添加到所述当前聚类文本信息集尾部，得到最新聚类文本信息集，并将所述头部子集中的最优标准文本信息作为对应时间戳的歌词文本信息。2.根据权利要求1所述的歌词提取方法，其特征在于，所述将所述头部子集中的最优标准文本信息作为对应时间戳的歌词文本信息，包括：计算所述头部子集中任两个标准文本信息的文本相似度；将文本相似度大于第二预设相似度阈值的多个标准文本信息组成集合，得到至少一个相同文本信息集；统计所有相同文本信息集中标准文本信息的数量，按标准文本信息的数量将相同文本信息集合降序排列；从排在第一位的相同文本信息集中随机选择任一标准文本信息作为最优标准文本信息。3.根据权利要求1所述的歌词提取方法，其特征在于，包括：若当前目标帧为初始目标帧时，将初始目标帧中的标准文本信息集作为最新聚类文本信息集，其中每个标准文本信息为对应子集的参照文本信息。4.根据权利要求1所述的歌词提取方法，其特征在于，所述识别当前目标帧的时间戳及当前目标帧的标准文本信息集，包括：对所述当前目标帧进行二值化；对二值化后的所述当前目标帧进行文字提取，得到包括至少一个标准文本信息的标准文本信息集。5.一种歌词提取装置，其特征在于，包括：数据获取模块，用于按预定时间间隔提取目标视频中的帧作为目标帧；识别模块，用于识别当前目标帧的时间戳及当前目标帧的标准文本信息集；计算模块，用于将所述标准文本信息集中的其一标准文本信息分别与当前聚类文本...

【专利技术属性】
技术研发人员：马哲，郭传基，刘剑，
申请(专利权)人：北京雷石天地电子技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人