【技术实现步骤摘要】
音频检索索引生成方法及装置
本申请涉及数据处理
,具体而言,涉及一种音频检索索引生成方法及装置。
技术介绍
在一些音频检索场景中,;这种情况下,需要基于音频的自身的一些特征进行检索,现有的特征提取方法主要是提取音频中一段时长的底层特征进行比对检索,这些底层特征容易受到提取时长的影响,并且底层特征数据量极大,无法做到高效迅速地检索。如何提供一种能反应音频本身特性又能进行高效检索的音频索引成为本领域亟待解决的问题。
技术实现思路
为了克服现有技术中的上述不足,本申请的目的在于提供一种音频检索索引生成方法,所述方法包括:提取待处理音频的音频特征,所述音频特征包括与时序相关的浮点数序列;根据预先划分的数值区间,将所述浮点数序列中的浮点数转换为该浮点数所在数值区间的区间标记,得到与该音频特征对应的区间标记序列;根据预设窗口长度及预设步长采用滑动窗口处理对所述区间标记序列进行数据提取,得到与所述音频特征对应的多个区间标记组,每个所述区间标记组包括时序上连续的多个区间标记;针对每个所述区间标记组,对该区间标记组中的多个区间标记进行哈希处理,得到与该区间标记组对应的N位哈希值; ...
【技术保护点】
1.一种音频检索索引生成方法,其特征在于,所述方法包括:提取待处理音频的音频特征,所述音频特征包括与时序相关的浮点数序列;根据预先划分的数值区间,将所述浮点数序列中的浮点数转换为该浮点数所在数值区间的区间标记,得到与该音频特征对应的区间标记序列;根据预设窗口长度及预设步长采用滑动窗口处理对所述区间标记序列进行数据提取,得到与所述音频特征对应的多个区间标记组,每个所述区间标记组包括时序上连续的多个区间标记;针对每个所述区间标记组,对该区间标记组中的多个区间标记进行哈希处理,得到与该区间标记组对应的N位哈希值;将所述多个区间标记组的哈希值中对应的位相加,获得由N个位的相加结果组 ...
【技术特征摘要】
1.一种音频检索索引生成方法,其特征在于,所述方法包括:提取待处理音频的音频特征,所述音频特征包括与时序相关的浮点数序列;根据预先划分的数值区间,将所述浮点数序列中的浮点数转换为该浮点数所在数值区间的区间标记,得到与该音频特征对应的区间标记序列;根据预设窗口长度及预设步长采用滑动窗口处理对所述区间标记序列进行数据提取,得到与所述音频特征对应的多个区间标记组,每个所述区间标记组包括时序上连续的多个区间标记;针对每个所述区间标记组,对该区间标记组中的多个区间标记进行哈希处理,得到与该区间标记组对应的N位哈希值;将所述多个区间标记组的哈希值中对应的位相加,获得由N个位的相加结果组成的特征数组;根据所述特征数组中数组成员的值是否大于0将所述特征数组的N个数组成员转换为N位二进制的音频索引值。2.根据权利要求1所述的方法,其特征在于,所述将所述多个区间标记组的哈希值中对应的位相加,获得由N个位的相加结果组成的特征数组的步骤,包括:针对每个哈希值,将值为0的位替换为-1;将多个替换处理后的哈希值对应的位相加,获得由N个位的相加结果组成的特征数组。3.根据权利要求1所述的方法,其特征在于,所述提取待处理音频的音频特征的步骤,包括:提取所述待处理音频的多个音频特征;所述将所述多个区间标记组的哈希值中对应的位相加,获得由N个位的相加结果组成的特征数组的步骤,包括:将每个音频特征对应的多个区间标记组的哈希值的对应位相加,获得由N个位的相加结果组成的特征数组。4.根据权利要求3所述的方法,其特征在于,所述音频特征包括梅尔频率倒谱系数或色度特征。5.根据权利要求1所述的方法,其特征在于,所述根据预先划分的数值区间,将所述浮点数序列中的浮点数转换为该浮点数所在数值区间的区间标记的步骤之前,所述方法还包括:根据预设的置信区间从所述浮点数序列中剔除所述置信区间之外的浮点数。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述待处理音频的音频索引值在...
【专利技术属性】
技术研发人员:王辰龙,李垚,
申请(专利权)人:厦门美图之家科技有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。