声音信号处理评估方法和装置制造方法及图纸

技术编号:34002805 阅读:47 留言:0更新日期:2022-07-02 12:35
本发明专利技术提供一种声音信号处理评估方法和装置。对合成声音信号进行声音信号处理以产生经处理声音信号。这合成声音信号是对主要信号加入次要信号所产生,主要信号只有语音信号,且声音信号处理相关于对合成声音信号除去次要信号。分别对经处理声音信号和主要信号取得声音特性。这声音特性包括文字内容,且文字内容是对经处理声音信号和主要信号进行语音转文字处理所产生。依据经处理声音信号和主要信号的声音特性之间的比较结果评估这声音信号处理。这比较结果包括经处理声音信号的文字内容对应于主要信号的正确性。藉此,可提供客观的评估结果。的评估结果。的评估结果。

【技术实现步骤摘要】
声音信号处理评估方法和装置


[0001]本专利技术涉及一种信号分析技术,尤其涉及一种声音信号处理评估方法和装置。

技术介绍

[0002]市面上已有许多提供噪声或噪音消除技术的扬声器、耳机或其他多媒体播放器。不同厂商所推出的噪声或噪音消除技术可能涉及到不同算法或机制,还可能达到不同效果。然而,现今没有可客观评量不同消除技术的方案。

技术实现思路

[0003]本专利技术实施例是针对一种声音信号处理评估方法和装置,可针对语音相关信号的声音信号处理提供客观的评量。
[0004]根据本专利技术的实施例,声音信号处理评估方法包括(但不仅限于)下列步骤:对合成声音信号进行声音信号处理以产生经处理声音信号。这合成声音信号是对主要信号加入次要信号所产生,主要信号只有语音信号,且声音信号处理相关于对合成声音信号除去次要信号。分别对经处理声音信号和主要信号取得声音特性。这声音特性包括文字内容,且文字内容是对经处理声音信号和主要信号进行语音转文字处理所产生。依据经处理声音信号和主要信号的声音特性之间的比较结果评估这声音信号处理。这比较结果包括经处理声音信号的文字内容对应于主要信号的正确性。
[0005]根据本专利技术的实施例,声音信号处理评估装置包括(但不仅限于)存储器和处理器。存储器用以存储数个软件模块。处理器耦接存储器,并用以加载且执行那些软件模块。那些软件模块包括声音信号处理模块、特性提取模块和评估模块。声音信号处理模块对合成声音信号进行声音信号处理以产生经处理声音信号。这合成声音信号是对主要信号加入次要信号所产生,主要信号只有语音信号,且声音信号处理相关于对合成声音信号除去次要信号。特性提取模块分别对经处理声音信号和主要信号取得声音特性。这声音特性包括文字内容,且文字内容是对经处理声音信号和主要信号进行语音转文字处理所产生。评估模块依据经处理声音信号和主要信号的声音特性之间的比较结果评估这声音信号处理。这比较结果包括经处理声音信号的文字内容对应于主要信号的正确性。
[0006]基于上述,依据本专利技术实施例的声音信号处理评估方法和装置,可确定语音相关的原信号和经声音信号处理的经处理声音信号两者在声音特性上的差异,并据以作为评估参考依据。其中,可确定两信号经语音转文字后的文字差异。藉此,可适用于评估针对语音信号相关的声音信号处理。
附图说明
[0007]包含附图以便进一步理解本专利技术,且附图并入本说明书中并构成本说明书的一部分。附图说明本专利技术的实施例,并与描述一起用于解释本专利技术的原理。
[0008]图1是依据本专利技术一实施例的声音信号处理评估装置的方块图;
Programmable Gate Array,FPGA)、特殊应用集成电路(Application

Specific Integrated Circuit,ASIC)、神经网络加速器或其他类似组件或上述组件的组合。在一实施例中,处理器150用以执行声音信号处理评估装置100的所有或部分作业,且可加载并执行存储器110所记录的各软件模块、文件和数据。
[0034]下文中,将搭配声音信号处理评估装置100中的各项组件、模块和信号说明本专利技术实施例所述的方法。本方法的各个流程可依照实施情形而调整,且并不只限于此。
[0035]图2是依据本专利技术一实施例的声音信号处理评估方法的流程图。请参照图2,声音信号处理模块113对合成声音信号S
C
进行声音信号处理以产生经处理声音信号S
P
(步骤S210)。具体而言,合成声音信号S
C
是合成模块111对主要信号S
M
加入次要信号S
S
所产生的。即,合成主要信号S
M
和次要信号S
S
可产生合成声音信号S
C
。假设主要信号S
M
只有语音信号。即,单纯人声。而次要信号S
S
可以是生物(例如,狗、猫、或婴儿)所发出声音、非生物(例如,空调器、吹发器或冰箱)运作声、合成声、环境声(例如,风声、树枝拍打声等)、对象互动作用的声音(例如,手指敲击键盘的声音、碗摔落地面等)或其组合。只要是主要信号S
M
以外的其他声音都可视为次要信号S
S

[0036]在一实施例中,合成模块111例如可对两信号S
M
,S
S
在频谱上迭加或采用其他合成技术。在另一实施例中,声音信号处理评估装置100可通过内建、外置或外部扬声器同时播放主要信号S
M
和次要信号S
S
,并进一步录制,以取得合成声音信号S
C

[0037]另一方面,在一实施例中,声音信号处理模型113对合成声音信号S
C
所进行的声音信号处理是相关于对合成声音信号S
C
除去次要信号S
S
。例如,声音信号处理的目的其中一个在于还原主要信号S
M
、或噪声消除。噪声/降噪抑制(或声源分离)技术例如是产生与噪声音波相位相反的信号、或利用独立成分分析(Independent Components Analysis,ICA)等方式自合成声音信号S
C
中消除噪声(即,次要信号S
S
),本专利技术实施例不加以限制。
[0038]值得注意的是,基于不同技术的声音信号处理对相同输入信号所输出的信号在频率、波形或振幅上可能有差异。若欲评估多种声音信号处理技术,声音信号处理模块113可整合这些声音信号处理技术,并分别采用不同声音信号处理技术来处理合成声音信号S
C
。此外,若欲了解特定声音信号处理对不同次要信号S
S
的除去能力,也可分别加入不同次要信号S
S

[0039]在一实施例中,声音信号处理评估装置100可通过内建、外置或外部扬声器分别播放主要信号S
M
和经处理声音信号S
P
,并进一步分别录制这两信号S
M
,S
P
,以作为后续分析使用。
[0040]特性提取模块115可分别对经处理声音信号S
P
和主要信号S
M
取得声音特性F
P
,F
M
(步骤S230)。具体而言,评估的确定依据是希望声音信号处理后可同时保存主要语音的声纹特性且提高语意识别度。在一实施例中,声音特性F
P
,F
M
包括声纹特征。特性提取模块115例如是采用有线性预估系数(Linear Predictive Coefficient,LPC)、倒谱系数、梅尔倒频谱系数(Mel

frequency Cepstrum Coefficient,MFCC)或其他特征参数提取方法来取得声纹特征。声纹特征可用于区别不同人物所发出的声音。由此可知,评估的确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声音信号处理评估方法,其特征在于,包括:对合成声音信号进行声音信号处理以产生经处理声音信号,其中所述合成声音信号是对主要信号加入次要信号所产生,所述主要信号只有语音信号,且所述声音信号处理相关于对所述合成声音信号除去所述次要信号;分别对所述经处理声音信号和所述主要信号取得声音特性,其中所述声音特性包括文字内容,且所述文字内容是对所述经处理声音信号和所述主要信号进行语音转文字处理所产生;以及依据所述经处理声音信号和所述主要信号的所述声音特性之间的比较结果评估所述声音信号处理,其中所述比较结果包括所述经处理声音信号的所述文字内容对应于所述主要信号的正确性。2.根据权利要求1所述的声音信号处理评估方法,其中评估所述声音信号处理的步骤包括:比较所述经处理声音信号和所述主要信号的所述文字内容中的字符差异,其中所述字符差异相关于所述文字内容中的对应字符是否相同;以及依据所述字符差异决定所述经处理声音信号相对于所述主要信号的文字正确率,其中所述文字内容的正确性相关于所述文字正确率。3.根据权利要求1所述的声音信号处理评估方法,其中所述声音特性还包括声纹特征,且评估所述声音信号处理的步骤包括:比较所述经处理声音信号和所述主要信号的所述声纹特征之间的声纹相似性,其中所述比较结果还包括所述声纹相似性。4.根据权利要求3所述的声音信号处理评估方法,其中评估所述声音信号处理的步骤包括:确定所述声纹相似性越高且所述文字内容的正确性越高者对应于较好的评估结果;以及确定所述声纹相似性越低或所述文字内容的正确性越低者对应于较差的评估结果。5.根据权利要求4所述的声音信号处理评估方法,其中所述声纹相似性相关于所述经处理声音信号和所述主要信号的特征矢量之间的距离,所述特征矢量是由所述声纹特征转换,且评估所述声音信号处理的步骤包括:将所述距离越近者视为所述声纹相似性越高者;以及将所述距离越远者视为所述声纹相似性越低者。6.一种声音信号处理评估装置,包括:存储器,存储多个软件...

【专利技术属性】
技术研发人员:杜博仁张嘉仁曾凯盟
申请(专利权)人:宏碁股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1