一种匹配检测方法及装置制造方法及图纸

技术编号：10644799 阅读：89 留言：0更新日期：2014-11-12 18:06

本发明专利技术实施例公开了一种匹配检测方法及装置，其中的方法可包括：构建音频文件的音频特征序列和字幕文件的字幕特征序列；根据所述音频特征序列和所述字幕特征序列，确定相关因子；采用所述相关因子进行相关运算，获得相关函数序列；根据所述相关函数序列，对所述音频文件和所述字幕文件进行匹配检测。本发明专利技术能够对音频文件和字幕文件进行匹配检测，满足对音频文件的应用需求，提升音频文件的应用智能性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网
，具体涉及音频处理
，尤其涉及一种匹配检测方法及装置。
技术介绍
随着互联网技术的发展，互联网音频库中收录了大量的诸如歌曲、歌曲片段等音频文件，关于互联网音频的应用也日渐增多，例如：K歌系统、听歌系统等等。在应用音频文件的过程中，用户通常希望播放音频文件的同时获得对应的字幕信息，例如：用户在演唱或收听某歌曲时，希望查看对应的歌词；等等，然而，音频文件与字幕文件常常会出现不匹配的情况，无法满足用户对音频文件的使用需求，从而降低了音频文件的应用智能性。
技术实现思路
本专利技术实施例所要解决的技术问题在于，提供一种匹配检测方法及装置，能够对音频文件和字幕文件进行匹配检测，满足对音频文件的应用需求，提升音频文件的应用智能性。本专利技术实施例第一方面提供一种匹配检测方法，可包括：构建音频文件的音频特征序列和字幕文件的字幕特征序列；根据所述音频特征序列和所述字幕特征序列，确定相关因子；采用所述相关因子进行相关运算，获得相关函数序列；根据所述相关函数序列，对所述音频文件和所述字幕文件进行匹配检测。本专利技术实施例第二方面提供一种匹配检测装置，可包括：构建模块，用于构建音频文件的音频特征序列和字幕文件的字幕特征序列；因子确定模块，用于根据所述音频特征序列和所述字幕特征序列，确定相关因子；相关运算模块，用于采用所述相关因子进行相关运算，获得相关函数序列；>匹配检测模块，用于根据所述相关函数序列，对所述音频文件和所述字幕文件进行匹配检测。实施本专利技术实施例，具有如下有益效果：本专利技术实施例中，可根据音频文件的音频特征序列和字幕文件的字幕特征序列，构建相关函数序列；通过分析所述相关函数序列，了解所述音频文件与所述字幕文件之间的相关性，从而实现了对音频文件和字幕文件之间的匹配检测，既满足了用户对于音频文件的应用过程中的实际需求，又提升了音频文件的应用智能性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本专利技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种匹配检测方法的流程图；图2为本专利技术实施例提供的另一种匹配检测方法的流程图；图3为图2所示的步骤S201的一个实施例的流程图；图4a为本专利技术实施例提供的一种构建音频文件的音频特征序列的方法的流程图；图4b为本专利技术实施例提供的一种构建字幕文件的字幕特征序列的方法的流程图；图5a为本专利技术实施例提供的一种确定相关因子的方法的流程图；图5b为本专利技术实施例提供的另一种确定相关因子的方法的流程图；图6a为本专利技术实施例提供的一种根据相关函数序列进行匹配检测的方法的流程图；图6b为本专利技术实施例提供的另一种根据相关函数序列进行匹配检测的方法的流程图；图7为本专利技术实施例提供的一种匹配检测装置的结构示意图；图8为本专利技术实施例提供的另一种匹配检测装置的结构示意图；图9为本专利技术实施例提供的一种预处理模块的结构示意图；图10a为本专利技术实施例提供的一种构建模块的结构示意图；图10b为本专利技术实施例提供的另一种构建模块的结构示意图；图11a为本专利技术实施例提供的一种因子确定模块的结构示意图；图11b为本专利技术实施例提供的另一种因子确定模块的结构示意图；图12a为本专利技术实施例提供的一种匹配检测模块的结构示意图；图12b为本专利技术实施例提供的另一种匹配检测模块的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图，对本专利技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本专利技术一部分实施例，而不是全部的实施例。基于本专利技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本专利技术保护的范围。本专利技术实施例中，音频文件可以包括但不限于：歌曲、歌曲片段等文件。字幕文件可以包括但不限于：歌词、歌词片段等文件。一个音频文件可由至少一个音频单句顺序排列而成，该至少一个音频单句的集合描述了音频文件中演唱内容部分；音频单句之间还可包括无演唱内容部分。以歌曲A为例，歌曲A的描述可表示如下：[661，770]，[661，20]a1[661，60]a2[721，170]a3[891，200]a4[1091，70]a5[1161，180]a6[1341，20]a7[1361，50]a8[1541，180]，[1541，20]b1[1561，50]b2[1611，20]b3[1631，30]b4[1661，0]b5[1661，10]b6[1671，20]b7[1701，30]b8[1871，730]，[1871，60]c1[1931，100]c2[2031，110]c3[2141，200]c4[2341，70]c5[2411，60]c6[2471，50]c7[2421，80]c8……上述歌曲A的描述中，诸如“a1a2a3a4a5a6a7a8”、“b1b2b3b4b5b6b7b8”、“c1c2c3c4c5c6c7c8”可分别用于表示一个音频单句，各音频单句之前的“[]”用于描述对应的音频单句的时间属性，其单位时间通常为ms，例如：上述[661，770]用于描述音频单句“a1a2a3a4a5a6a7a8”的时间属性，其中的“661”表示音频单句“a1a2a3a4a5a6a7a8”的开始时间，“770”表示音频单句“a1a2a3a4a5a6a7a8”的持续时间，假设歌曲A共5分钟，音频单句“a1a2a3a4a5a6a7a8”则从第661ms开始演唱，持续770ms结束演唱。各音频单句中，每个音频字之前的“[]”用于描述对应的音频字的时间属性，其单位时间通常为ms，例如：上述[661，20]用于描述音频字“a1”的时间属性，其中的“661”表示音频字“a1”的开始时间，“20”表示音频字“a1”的持续时间。按照开始时间的先后顺序，可确定音频文件包含的各音频单句的顺序，例如：根据上述歌曲A的描述，音频单句“a1a2a3a4a5a6a7a8”为第一个音频单句，其在歌曲A中的顺序为1；音频单句“b1b2b3b4b5b6b7b8”为第二个音频单句，其在歌曲A中的顺序为2；以此类推。可以理解的是，每个音频单句开始之前或结束之后还可包含无演唱内容，例如：上述歌曲A的0-661ms时间段则为无演唱内容部分，该部本文档来自技高网...
一种匹配检测方法及装置

【技术保护点】
一种匹配检测方法，其特征在于，包括：构建音频文件的音频特征序列和字幕文件的字幕特征序列；根据所述音频特征序列和所述字幕特征序列，确定相关因子；采用所述相关因子进行相关运算，获得相关函数序列；根据所述相关函数序列，对所述音频文件和所述字幕文件进行匹配检测。

【技术特征摘要】
1.一种匹配检测方法，其特征在于，包括：
构建音频文件的音频特征序列和字幕文件的字幕特征序列；
根据所述音频特征序列和所述字幕特征序列，确定相关因子；
采用所述相关因子进行相关运算，获得相关函数序列；
根据所述相关函数序列，对所述音频文件和所述字幕文件进行匹配检测。
2.如权利要求1所述的方法，其特征在于，所述构建音频文件的音频特征
序列和字幕文件的字幕特征序列之前，还包括：
对所述音频文件和所述字幕文件进行预处理。
3.如权利要求2所述的方法，其特征在于，所述对所述音频文件和所述字
幕文件进行预处理，包括：
获取所述音频文件的源播放时长和所述字幕文件的源显示时长；
选取所述源播放时长和所述源显示时长二者中的最大者，将所选取的最大
者作为基准时长；
采用所述基准时长对所述音频文件的源播放时长进行归整处理，获得所述
音频文件的目标播放时长；
采用所述基准时长对所述音频文件的源显示时长进行归整处理，获得所述
字幕文件的目标显示时长。
4.如权利要求3所述的方法，其特征在于，所述构建音频文件的音频特征
序列，包括：
按照预设时间刻度对所述音频文件的目标播放时长进行等分处理，获得至
少一个播放时间片；
根据所述至少一个播放时间片的数量，确定构建所述音频特征序列的音频
元素的数量；
根据所述至少一个播放时间片中各播放时间片的顺序，确定构建所述音频
特征序列的各音频元素的索引；
计算所述各播放时间片内的能量；
根据所述各播放时间片内的能量，设置构建所述音频特征序列的各音频元
素的值；
按照构建所述音频特征序列的各音频元素的值及索引，构建所述音频文件
的音频特征序列。
5.如权利要求4所述的方法，其特征在于，所述构建字幕文件的字幕特征
序列，包括：
按照预设时间刻度对所述字幕文件的目标显示时长进行等分处理，获得至
少一个显示时间片；
根据所述至少一个显示时间片的数量，确定构建所述字幕特征序列的字幕
元素的数量；
根据所述至少一个显示时间片中各显示时间片的顺序，确定构建所述字幕
特征序列的各字幕元素的索引；
根据所述各显示时间片与所述字幕文件中包含的字符的对应关系，设置构
建所述字幕特征序列的各字幕元素的值；
按照构建所述字幕特征序列的各字幕元素的值及索引，构建所述字幕文件
的字幕特征序列。
6.如权利要求1-5任一项所述的方法，其特征在于，所述根据所述音频特
征序列和所述字幕特征序列，确定相关因子，包括：
对所述音频特征序列进行循环移动，获得所述音频文件的音频转换序列；
统计所述音频转换序列与所述字幕特征序列中等值元素的数量，获得第一
相关因子；
统计所述音频转换序列与所述字幕特征序列中非等值元素的数量，获得第
二相关因子。
7.如权利要求1-5任一项所述的方法，其特征在于，所述根据所述音频特
征序列和所述字幕特征序列，确定相关因子，包括：
对所述字幕特征序列进行循环移动，获得所述字幕文件的字幕转换序列；
统计所述音频特征序列与所述字幕转换序列中等值元素的数量，获得第三
相关因子；
统计所述音频特征序列与所述字幕转换序列中非等值元素的数量，获得第
四相关因子。
8.如权利要求1-5任一项所述的方法，其特征在于，所述根据所述相关函
数序列，对所述音频文件和所述字幕文件进行匹配检测，包括：
计算所述相关函数序列的最大值；
判断所述最大值是否大于或等于预设阈值；
若所述最大值大于或等于所述预设阈值，确定所述音频文件与所述字幕文
件相匹配；
若所述最大值小于所述预设阈值，确定所述音频文件与所述字幕文件不匹
配。
9.如权利要求1-5任一项所述的方法，其特征在于，所述根据所述相关函
数序列，对所述音频文件和所述字幕文件进行匹配检测，包括：
根据所述相关函数序列，计算所述音频文件的播放时间与所述字幕文件的
显示时间之间的时间差；
判断所述时间差是否位于预设时间范围内；
若所述时间差位于所述预设时间范围内，确定所述音频文件与所述字幕文
件相匹配；
若所述时间差位于所述预设时间范围外，确定所述音频文件与所述字幕文
件不匹配。
10.如权利要求9所述的方法，其特征在于，所述确定所述音频文件与所
述字幕文件相匹配之后，还包括：
根据所述时间差，对所述音频文件的播放时间和所述字幕文件的显示时间
进行校准处理。
11.一种匹配检测装置，其特征在于，包括：
构建模块，用于构建音频文件的音频特征序列和字幕文件的字幕特征序列；
因子确定模块，用于根据所述音频特征序列和...

【专利技术属性】
技术研发人员：赵伟峰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人