一种基于特征值聚类的声学信号模式分类方法技术

技术编号:37801117 阅读:7 留言:0更新日期:2023-06-09 09:31
一种基于特征值聚类的声学信号模式分类方法,属于声学信号模式分类技术领域。它包括以下步骤:S1、使用固定时长将时域声音信号划成连续的帧片段,利用傅立叶变换,将各片段转换成频谱片段;S2、使用频谱片段的矢量间的相似度量/相异度量构造相似/相异的度量矩阵;S3、将度量矩阵进行谱分解,得到特征矢量矩阵P和特征值组成的谱矩阵;S4、对谱特征值序列进行k均值聚类,得到k组结果;S5、将特征值聚类的结果映射到频谱片段集合。本发明专利技术直接使用特征值进行k均值聚类,聚类矢量为一维纯量,不需要使用PCA技术进行降低维度处理,从而使得计算效率达到最优,适用于声学降噪、声学回声的DTD检测、回声分离以及声源定位等技术领域。回声分离以及声源定位等技术领域。回声分离以及声源定位等技术领域。

【技术实现步骤摘要】
一种基于特征值聚类的声学信号模式分类方法


[0001]本专利技术属于声学信号模式分类
,具体涉及一种基于特征值聚类的声学信号模式分类方法。

技术介绍

[0002]聚类是一种无监督模式分类技术,一般不需要人工对数据进行标注,但需要事先确定好聚类的类型数目。在各种聚类技术里,谱聚类是近年来发展迅猛的一种聚类技术,它在初始阶段有点类似传统的层次聚类法,即构造全体参与聚类的数据之间的互相似性度量(或互相异性度量),该度量是一张N
×
N阶的对称矩阵表,N即为参与聚类的全体原始数据的个数。然后计算该矩阵的谱分解,并对特征矢量矩阵(即相似矩阵)进行标准化(施密特正交化、及单位化),在借鉴传统的PCA统计分析方法的基础上进行降维,根据特征值的大小分布,取集中的一部分(占据总值80%以上份额)特征值所对应的部分特征矢量矩阵进行聚类。该部分特征矢量矩阵的行数仍旧是参与聚类的全体原始数据的个数,但列数已经低于N了,这就是PCA降维运用的结果。对所有的部分特征矢量矩阵的行向量进行k均值聚类,最后将聚类结果对应到原始数据从而得到真正需要的原始数据的分类情况。
[0003]谱聚类的缺点是当参与聚类的原始数据个数很多,即N很大,那么即便采用PCA降维后,参与k均值聚类的部分特征矢量矩阵的行向量的维数也是足够大的,这对k均值聚类无疑是一种负担。此外,最后怎么将部分特征矢量矩阵的行向量的聚类情况对应到原始数据的分类,一般认为,部分特征矢量矩阵的行向量个数是与参与聚类的原始数据的个数是相同的,直接将第一行对应到第一个原始数据,第二行对应到第二个原始数据,
……
,依次类推。
[0004]声学信号类型识别是各类声学工程解决方案的关键问题。例如,在声学降噪领域,无论主动降噪还是被动降噪,均涉及到噪声和有效声信号的区分。对于单声道盲降噪(一种被动降噪模式),需要根据信号频谱分析进行背景噪声和前景声音的区分;对于多声道被动降噪,需要区分声学BIN的方向、并跟踪;对于多声道主动降噪,需要识别背景噪声、前景音,然后生成反相位的背景音。
[0005]在声学回声消除里,使用信号分离技术实现回声消除、或DTD语音双工检测都需要识别、辨别近端信号和远端信号。在声学信号定位里,需要辨别不同方位的源信号和干扰信号。在鸡尾酒效应中,需要将人声、乐音,或者男声、女声,抑或是不同语种的语音进行分离,同样需要辨识不同的信号,这些都是使用不同技术实现声学信号识别的例子。

技术实现思路

[0006]针对现有技术中存在的上述问题,本专利技术的目的在于提供一种基于特征值聚类的声学信号模式分类方法,其能够降低聚类矢量的维数,不需要使用PCA技术进行降低维度处理,从而使得计算效率达到最优。
[0007]本专利技术提供如下技术方案:
[0008]一种基于特征值聚类的声学信号模式分类方法,包括以下步骤:
[0009]S1、使用固定时长将时域声音信号划成连续的帧片段,利用傅立叶变换,将各片段转换成频谱片段;
[0010]S2、使用频谱片段的矢量间的相似度量/相异度量构造相似/相异的度量矩阵;
[0011]S3、将度量矩阵进行谱分解,得到特征矢量矩阵P和特征值组成的谱矩阵;
[0012]S4、对谱特征值序列进行k均值聚类,得到k组结果;
[0013]S5、将特征值聚类的结果映射到频谱片段集合。
[0014]进一步的,所述步骤S1中,各片段的频谱为待聚类的原始数据,其均是维数为d的矢量,将原始数据记为矢量组,表示如下:
[0015][0016]其中,N为片段数,即原始数据的个数。
[0017]进一步的,所述步骤S2中,矩阵为实对称矩阵;相异度量采用欧氏距离,相似度量采用相关性系数、Peasrson相关系数或关于欧氏距离的减函数。
[0018]进一步的,所述步骤S2的具体过程如下:
[0019]从原始数据中选取数据和将数据和的相似或相异度量值记作:
[0020][0021]其中,和
[0022]则度量矩阵表示如下:
[0023][0024]进一步的,所述步骤S3中,谱矩阵的表示如下:
[0025][0026]该谱矩阵与度量矩阵的关系如下:
[0027][0028]进一步的,所述步骤S4的具体过程如下:
[0029]对谱特征值序列{λ1,λ2,

,λ
N
}进行k均值聚类,得到k组结果,
[0030][0031][0032]……
[0033][0034]其中,n1+n2+...+n
k
=N。
[0035]进一步的,所述步骤S5的具体过程如下:
[0036]S5.1将原始数据的矢量通过线性插值,使得维数达到原来维数与N的最小公倍数;
[0037]S5.2将某原始数据与k个类别里每个类别对应的各个特征矢量逐一作内积,并取每个类别的平均投影值,将该原始数据归属于平均投影值最大的类别;即完成了将特征值聚类的结果映射到原始数据的分类。
[0038]通过采用上述技术,与现有技术相比,本专利技术的有益效果如下:
[0039]1)本专利技术直接使用特征值进行k均值聚类,聚类矢量为一维纯量,不需要使用PCA技术进行降低维度处理,从而使得计算效率达到最优,适用于声学降噪、声学回声的DTD检测、回声分离以及声源定位等

[0040]2)本专利技术中,将原始数据进行插值,使之维数与特征矢量的维数一致,即采用向特征矢量投影的排序方式,将特征值聚类的具体情况对应到原始数据。
附图说明
[0041]图1为本专利技术实施例的系统框图。
具体实施方式
[0042]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合说明书附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0043]相反,本专利技术涵盖任何由权利要求定义的在本专利技术的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本专利技术有更好的了解,在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本专利技术。
[0044]请参阅图1,本实施例与传统的谱聚类不同之处在于,它不需要对特征矢量矩阵的行向量进行k均值聚类,而是直接使用特征值进行k均值聚类。这样的好处是聚类矢量的维数很低,直接是一维的纯量,此时不需要使用PCA技术进行降低维度处理,从而使得计算效率达到最优。其次,特征值聚类的具体情况对应到原始数据,可以采用向特征矢量投影的排序方式来确定。
[0045]和传统谱聚类一样,原始数据的维数和特征值矩阵的行向量维数是不一致的;其中,后者在传统谱聚类里就是降维后低于N的整数,而在本案则是N;因此,在考虑原始数据和特征矢量作内积投影时,首先要将原始数据进行插值,使之维数与特征矢量的维数一致。
[0046]具体步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征值聚类的声学信号模式分类方法,其特征在于:包括以下步骤:S1、使用固定时长将时域声音信号划成连续的帧片段,利用傅立叶变换,将各片段转换成频谱片段;S2、使用频谱片段的矢量间的相似度量/相异度量构造相似/相异的度量矩阵;S3、将度量矩阵进行谱分解,得到特征矢量矩阵P和特征值组成的谱矩阵;S4、对谱特征值序列进行k均值聚类,得到k组结果;S5、将特征值聚类的结果映射到频谱片段集合。2.根据权利要求1所述的一种基于特征值聚类的声学信号模式分类方法,其特征在于所述步骤S1中,各片段的频谱为待聚类的原始数据,其均是维数为d的矢量,将原始数据记为矢量组,表示如下:其中,N为片段数,即原始数据的个数。3.根据权利要求2所述的一种基于特征值聚类的声学信号模式分类方法,其特征在于所述步骤S2中,矩阵为实对称矩阵;相异度量采用欧氏距离,相似度量采用相关性系数、Peasrson相关系数或关于欧氏距离的减函数。4.根据权利要求3所述的一种基于特征值聚类的声学信号模式分类方法,其特征在于所述步骤S2的具体过程如下:从原始数据中选取数据和将数据和的相似或相异度量值记作:其中,和则度量矩阵表示如下:5.根据权利要求4所述的一种基于...

【专利技术属性】
技术研发人员:陆成刚张卫魏小彬杨利中南哲白晓迪
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1