一种基于向量数据库的音频搜索方法技术

技术编号:41745908 阅读:46 留言:0更新日期:2024-06-21 21:32
本发明专利技术公开了一种基于向量数据库的音频搜索方法,向量数据库构建方法如下:S1、将原始音频转化为梅尔频谱的语谱图,再转换到对数刻度的语谱图;S2、将对数刻度语谱图进行压缩并二值化;S3、对二值化图像提取特征;S4、将特征向量与所对应的时间戳一起存入数据库;通过对所有待入库的音频进行步骤S1至步骤S4的处理,完成数据库的构建;进行音频搜索时,先将待匹配音频按照步骤S1至步骤S3进行处理,得到待匹配音频特征向量,然后将待匹配音频特征向量逐一与数据库中的特征向量两两计算相似度,从而得到最相似的特征向量以及所对应的时间戳,从而得到搜索的待匹配音频的准确位置。本方案适用于音频搜索领域。

【技术实现步骤摘要】

本专利技术涉及音频搜索匹配领域,尤其是涉及一种基于向量数据库的音频搜索方法


技术介绍

1、音频搜索技术解决的是用一段音频搜索另一段音频的问题。该技术包含两个核心点:1)音频特征的抽取;2)音频特征的搜索匹配。

2、音频数据具有连续性,这使得准确在一段长音频中定位匹配到所求部分变得相对较难;并且音频在传输过程中会受到干扰造成失真,这会影响匹配的准确度;因此如何找到适合的音频特征,使得该特征既可以保证匹配准确,有具有较强的抗噪抗干扰能力是一个难题。并且在此基础上需要考虑如何提高效率。如何使整个处理过程变得更加快速高效。


技术实现思路

1、本专利技术主要是解决现有技术所存在的特征选取困难、易受干扰、匹配准确度低等的技术问题,提供一种特征明显、匹配准确、效率高的基于向量数据库的音频搜索方法。

2、本专利技术针对上述技术问题主要是通过下述技术方案得以解决的:一种基于向量数据库的音频搜索方法,所述向量数据库构建方法如下:

3、s1、将原始音频转化为梅尔频谱的语谱图,再转换到对数刻度的本文档来自技高网...

【技术保护点】

1.一种基于向量数据库的音频搜索方法,其特征在于,所述向量数据库构建方法如下:

2.根据权利要求1所述的一种基于向量数据库的音频搜索方法,其特征在于,所述步骤S1具体为:

3.根据权利要求1所述的一种基于向量数据库的音频搜索方法,其特征在于,所述步骤S2具体为:

4.根据权利要求1或2或3所述的一种基于向量数据库的音频搜索方法,其特征在于,所述步骤S3具体为:

【技术特征摘要】

1.一种基于向量数据库的音频搜索方法,其特征在于,所述向量数据库构建方法如下:

2.根据权利要求1所述的一种基于向量数据库的音频搜索方法,其特征在于,所述步骤s1具体为:

3....

【专利技术属性】
技术研发人员:赵天成张璐张得军
申请(专利权)人:杭州联汇科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1