一种音频的储存和检索方法技术

技术编号:25806121 阅读:31 留言:0更新日期:2020-09-29 18:40
本发明专利技术涉及一种音频的储存和检索方法,在存储音频数据时,将音频数据对应的PCM波形中的拐点进行统计和拐点的坐标进行记录,同时将相邻拐点横向距离和纵向距离进行计算并记录,从而得出一个可以大致反应音频数据PCM波形的数据列,将冗余信息剔除,节省存储空间;检索时,按照同样的步骤获得音频样本的数据列,再通过分步检索,首先将音频样本中的部分数据列带入至存储音频中的数据列中,如果符合再将音频样本中的全部的数据列带入至存储音频中的数据列中,如果符合再将音频样本的PCM波形带入至存储音频中的PCM波形中,分段检索,实现先粗略再精细的检索方式,避免浪费大量的运算力进行逐一对比,从而提高检索效率。

【技术实现步骤摘要】
一种音频的储存和检索方法
本专利技术涉及音频处理
,具体是一种音频的储存和检索方法。
技术介绍
随着多媒体技术的发展,音频检索作为研究热点,已经在广告检索、网络监管领域得到了广泛应用。音频检索,是从待检音频中检索并定位与指定音频(或者称为样本音频)同源的音频片段。当然,同源并非完全相同,也可能经过翻录或者编码压缩等处理。目前,一种音频检索方法是,将待检音频与样本音频按相同的时间间隔划分成帧系列,分别提取各帧的语音特征,并计算对应位置上的两个语音特征的距离,将各个距离累加后,根据距离和值来判断待检音频与样本音频的相似度。但是,由于样本音频通常较短,它在待检音频中的位置是不确定的,因此,需要采用滑移窗口的方式,依次在待检音频中,执行上述音频检索方法,以在待检音频中检索并定位样本音频。然而,以上音频检索方式,运算量较大,检索效率较低。
技术实现思路
有鉴于此,本专利技术的目的是提供一种音频的储存和检索方法,能够对音频进行压缩存储,同时检索时能够减少运算量,提高检索速度和正确率。本专利技术的一种音频的储存和检索方法,包括步骤:步骤S101,将音频数据进行模数转换,同时按照特定的采样率f将音频进行PCM编码,从而数字音频转换为在横轴为时间纵轴为音强的坐标轴上的波形;步骤S102,将获得的PCM音频数据中的冗余信息进行剔除;步骤S103,将剔除冗余信息后的PCM音频编码进行拐点统计,并对拐点进行标记,标记出拐点An处的坐标值(xn,yn);步骤S104,计算出所有的相邻拐点An之间的横坐标和纵坐标的差值(Δx,Δy),将其记录在前一个或者后一个的拐点信息内,从而获得音调和音强的两个的拐点数据列S(Δxn)和S(Δyn);步骤S105,将PCM音频数据的波形还原为特定格式的音频进行存储。进一步地,所述步骤S102中的冗余信息为音强小于10分贝的PCM音频数据。进一步地,所述步骤S103中的拐点统计的步骤包括:S10301,在PCM坐标轴上的PCM音频数据的波形上任意取4个相邻的点A1(x1,y1)、A2(x2,y2)、A3(x3,y3)和A4(x4,y4),取A1(x1,y1)和A2(x2,y2),得到正向直线方程L12(x,y)=(x2-x1)(y-y1)+(y1-y2)(x-x1);S10302,计算函数值L12(x3,y3),如果L12(x3,y3)小于0,则确定A3(x3,y3)位于正向直线L12的内侧,如果L12(x3,y3)大于0,则确定A3(x3,y3)位于正向直线L12的外侧,从而确定点A3(x3,y3)位于得到正向直线方程L1的哪一侧,然后再取点A2(x2,y2),A3(x3,y3)得到另一正向直线方程L23(x,y)=(x3-x2)(y-y2)+(y2-y3)(x-x2),计算函数值L23(x4,y4),可以确定点A4(x4,y4)位于得到正向直线方程L2的哪一侧,如果L12(x3,y3)*L23(x4,y4)<0,可以得出点A3(x3,y3)是一个拐点,否则A3(x3,y3)不是拐点;S10303,重复上述计算步骤,即可判断A3,A4,A5,......,An-1是否为拐点。本专利技术还提供一种音频的检索方法,其特征在于:包括步骤:步骤S201,判断音频样本为模拟音频还是数字音频,并进行对应的拐点统计;步骤S20101,如果音频样本为模拟音频,对音频样本进行模数转换,同时按照采样率f将音频进行PCM编码,同时按照所述步骤S103和步骤S104对音频样本进行拐点信息标记,从而获得两个时间轴和音强轴上的检索数据列S1(Δxi)和S1(Δyi);步骤S20102,如果音频样本为数字音频,直接获取并还原音频样本的波形,同时按照所述步骤S103和步骤S104对音频样本进行拐点信息标记,从而获得两个时间轴和音强轴上的检索数据列S1(Δxi)和S1(Δyi);步骤S202,先将S1(Δxi)中的相邻的至少2个数据S1(Δx1,Δx2...Δxn),代入至S(Δxn)中,当存储的音频数据中有一段或者多段同时满足:S1(Δx1,Δx2...Δxn)=α*S(Δx1,Δx2...Δxn),S1(Δy1,Δy2...Δyn)=β*S(Δy1,Δy2...Δyn),α和β为任意倍数,则将S1(Δxi)中其他所有的数据带入至S(Δxn)中进行验证,步骤S20201,如果完全符合S1(Δyi)=α*S(Δyn),α和β为任意倍数,则将音频样本的PCM波形与存储的音频数据的的PCM波形的对应位置进行对比,如果判断音频样本全部数据PCM1(x),PCM1(y)与存储的音频数据对应位置PCM2(x),PCM2(y)有超过阈值的符合PCM1(x)=α*PCM2(x),PCM1(y)=β*PCM2(y)则判断音频样本与存储的音频数据符合;步骤S20202,如果验证不完全满足S2(Δyi)=α*S(Δyn),α和β为任意倍数,则带入到该音频数据中的其他满足S1(Δx1,Δx2...Δxn)=α*S(Δx1,Δx2...Δxn),S1(Δy1,Δy2...Δyn)=β*S(Δy1,Δy2...Δyn),α和β为任意倍数的数据段中进行验证,直至将该音频数据验证完,如果均不符合,则为不符合。进一步地,所述步骤S20201中的阈值为80%。本专利技术的有益效果是:本专利技术的一种音频的储存和检索方法,在存储音频数据时,将音频数据对应的PCM波形中的拐点进行统计和拐点的坐标进行记录,同时将相邻拐点横向距离和纵向距离进行计算并记录,从而得出一个可以大致反应音频数据PCM波形的数据列,将冗余信息剔除,节省存储空间;检索时,按照同样的步骤获得音频样本的数据列,再通过分步检索,首先将音频样本中的部分数据列带入至存储音频中的数据列中,如果符合再将音频样本中的全部的数据列带入至存储音频中的数据列中,如果符合再将音频样本的PCM波形带入至存储音频中的PCM波形中,分段检索,实现先粗略再精细的检索方式,避免浪费大量的运算力进行逐一对比,从而提高检索效率,最后通过PCM波形对比还可以提高准确率,同时本专利技术还可以对压缩后的音频数据进行精确快速地检索。附图说明下面结合附图和实施例对本专利技术作进一步描述:图1为本专利技术的存储过程的流程图;图2为本专利技术的拐点统计流程图;图3为本专利技术的检索流程图。具体实施方式如图1-3所示:本实施例的一种音频的储存和检索方法,包括步骤:步骤S101,将音频数据进行模数转换,数字格式通常有CD、WAV、MP3等,本实施例中的数字音频指离散化处理后未经过进一步压缩的数字音频格式,转换后按照的采样率f将音频进行PCM编码,采样率f≥21KHz,从而数字音频转换为在横轴为时间纵轴为音强的坐标轴上的离散波形;步骤S102,将获得的PCM音频数据中的冗余信息进行剔除,冗余信息为音强小于10分贝的PCM音频数据,人耳对本文档来自技高网...

【技术保护点】
1.一种音频的储存方法,其特征在于:包括步骤:/n步骤S101,将音频数据进行模数转换,同时按照特定的采样率f将音频进行PCM编码,从而数字音频转换为在横轴为时间纵轴为音强的坐标轴上的波形;/n步骤S102,将获得的PCM音频数据中的冗余信息进行剔除;/n步骤S103,将剔除冗余信息后的PCM音频编码进行拐点统计,并对拐点进行标记,标记出拐点An处的坐标值(x

【技术特征摘要】
1.一种音频的储存方法,其特征在于:包括步骤:
步骤S101,将音频数据进行模数转换,同时按照特定的采样率f将音频进行PCM编码,从而数字音频转换为在横轴为时间纵轴为音强的坐标轴上的波形;
步骤S102,将获得的PCM音频数据中的冗余信息进行剔除;
步骤S103,将剔除冗余信息后的PCM音频编码进行拐点统计,并对拐点进行标记,标记出拐点An处的坐标值(xn,yn);
步骤S104,计算出所有的相邻拐点An之间的横坐标和纵坐标的差值(Δx,Δy),将其记录在前一个或者后一个的拐点信息内,从而获得音调和音强的两个的拐点数据列S(Δxn)和S(Δyn);
步骤S105,将PCM音频数据的波形还原为特定格式的音频进行存储。


2.根据权利要求1所述的一种音频的储存和检索方法,其特征在于:所述步骤S102中的冗余信息为音强小于10分贝的PCM音频数据。


3.根据权利要求1所述的一种音频的储存和检索方法,其特征在于:所述步骤S103中的拐点统计的步骤包括:
S10301,在PCM坐标轴上的PCM音频数据的波形上任意取4个相邻的点A1(x1,y1)、A2(x2,y2)、A3(x3,y3)和A4(x4,y4),取A1(x1,y1)和A2(x2,y2),得到正向直线方程L12(x,y)=(x2-x1)(y-y1)+(y1-y2)(x-x1);
S10302,计算函数值L12(x3,y3),如果L12(x3,y3)小于0,则确定A3(x3,y3)位于正向直线L12的内侧,如果L12(x3,y3)大于0,则确定A3(x3,y3)位于正向直线L12的外侧,从而确定点A3(x3,y3)位于得到正向直线方程L1的哪一侧,
然后再取点A2(x2,y2),A3(x3,y3)得到另一正向直线方程L23(x,y)=(x3-x2)(y-y2)+(y2-y3)(x-x2),
计算函数值L23(x4,y4),可以确定点A4(x4,y4)位于得到正向直线方程L2的哪一侧,如果L12(x3,y3)*L23(x4,y4)<0,可以得出点A3(x3,y3)是一个拐点,否则A3(x3,y3)不是拐点;
S10303,重复上述计算步骤,即可判断A...

【专利技术属性】
技术研发人员:龙图景刘政伟
申请(专利权)人:北京凯视达信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1