当前位置: 首页 > 专利查询>西门子公司专利>正文

一种中文语音信号处理方法、装置和助听设备制造方法及图纸

技术编号:8563593 阅读:162 留言:0更新日期:2013-04-11 05:30
本发明专利技术公开了一种中文语音信号处理方法、装置和助听设备,针对中文语音声调具有辨别词意的重要特性,通过增大中文语音信号中每个音节对应的基频曲线的斜率对每个音节对应的基频曲线进行调整,并可以通过调整后的基频曲线合成对应的音节,从而提高感音性耳聋患者对每个音节声调的识别率,进而提高感音性耳聋患者对中文语音的分辨能力。

【技术实现步骤摘要】

本专利技术涉及数字信号处理
,特别是一种中文语音信号处理方法、装置和助听设备
技术介绍
根据2006年的统计数据,我国大约有2780万人存在听力障碍。助听技术作为听力障碍的有效解决手段,越来越受到人们的关注。而伴随着科技的进步,数字信号处理技术逐步应用到助听领域。耳聋分为传导性耳聋、感音神经性耳聋及混合型耳聋,其中,罹患感音神经性耳聋的耳聋患者占了相当大的比例。感音神经性耳聋又可以分为蜗性(也叫感音性)耳聋、蜗后耳聋、以及中枢性耳聋。由于耳蜗的一项重要的功能就是分析处理听觉信息,感音性耳聋患者由于耳蜗受损可能导致语音分析能力下降,声调识别能力变差。目前的助听器侧重于声音振幅的放大,对于传导性耳聋效果很好,而对于感音性耳聋,不能达到理想的助听效果,尤其噪声环境下这种不理想更为明显。因此,对于感音性耳聋,可用于语音分析能力弥补的助听器会带来较好的效果。目前,大部分可用于语音分析能力弥补的助听器是根据西方语音来研究和开发的,中文用户无法使用。这是由于中文语音与西方语音存在多方面不同,如(I)中文语音为单音节带调语言;(2)中文语音为辅音与元音结合的结构,不同于西方语音存在多个辅音串的结构。由于中文语音和西方语音存在的差异,迫切需要一种针对中文语音的信号处理方法,提高感音性听障患者的声调识别率,进而提高感音性听障患者的言语理解度。
技术实现思路
有鉴于此,本专利技术提出了一种中文语音信号处理方法,用以提高感音性耳聋患者对声调的感知能力。本专利技术还提供一种中文语音信号处理装置及一种助听设备。因此,根据本专利技术一实施例,提供一种中文语音信号处理方法,包括对待处理中文语音信号进行音节切分,得到该待处理中文语音信号包含的至少一个音节;确定所述至少一个音节中每个音节对应的基频曲线;增大所述基频曲线的斜率;合成所述斜率增大后的基频曲线对应的音节。根据本专利技术另一实施例,提供一种中文语音信号处理装置,该装置包括音节切分模块11,用于对待处理中文语音信号进行音节切分,得到该待处理中文语音信号包含的至少一个音节;基频曲线确定模块12,用于确定所述至少一个音节中每个音节对应的基频曲线;增强模块13,用于增大所述基频曲线的斜率;合成模块14,用于合成所述斜率增大后的基频曲线对应的音节。根据本专利技术另一实施例,提供一种助听设备,该助听设备包括所述中文语音信号处理装置。根据本专利技术实施方式,针对中文语音声调具有辨别词意的重要特性,通过增大中文语音信号中每个音节对应的基频曲线的斜率对每个音节对应的基频曲线进行调整,并可以通过调整后的基频曲线合成对应的音节,从而提高感音性耳聋患者对每个音节声调的识别率,进而提高感音性耳聋患者对中文语音的分辨能力。根据本专利技术实施方式,还包括确定合成的每个音节与对待处理中文语音信号进行音节切分获得的每个音节的对应关系,按照切分后获得的每个音节在所述待处理中文语音信号中的先后顺序,依次输出切分后获得的每个音节对应的合成后的音节的步骤,使得感音性耳聋患者可以完整地理解连续的中文语音信号的含义。根据本专利技术实施方式,可以利用以下方式中的一种确定待处理中文语音信号将设定时长内接收到的中文语音信号作为所述待处理中文语音信号,或者,对已接收到的中文语音信号进行端点检测,将检测出的每一段中文语音信号依次作为所述待处理中文语音信号。根据本专利技术实施方式,在确定每个音节对应的基频曲线时,具体可以获得一个音节在每个采样时刻的基频,利用获得的每个采样时刻的基频确定该音节对应的基频曲线。根据本专利技术实施方式,提供了一种具体的公式来增大基频曲线的斜率,并提供了一种具体的公式来增大基频曲线的斜率和平均值。根据本专利技术实施方式,可以根据音节对应的声调种类,增大基频曲线的斜率,从而可以针对每个声调种类分别确定对应的斜率增大方式,提高声调的识别率。附图说明下面将通过参照附图详细描述本专利技术的优选实施例,使本领域的普通技术人员更清楚本专利技术的上述及其它特征和优点,附图中图1为根据本专利技术一实施例的中文语音信号处理方法的步骤流程图;图2(a)、图2(b)、图2(c)和图2(d)为根据本专利技术一实施例的基频曲线增大斜率和平均值前后的对照示意图;图3为本专利技术另一实施例的中文语音信号处理装置的结构示意图。具体实施例方式本专利技术实施例中,利用中文语音声调可以辨别词意的的特性,针对中文语音中的声调进行强调,从而提高使用者对中文语音的识别率。为使本专利技术的目的、技术方案和优点更加清楚,以下举实施例对本专利技术进一步详细说明。本专利技术一实施例提供一种中文语音信号处理方法,图1为该方法的步骤流程图,该方法包括步骤101、对待处理中文语音信号进行音节切分,得到该待处理中文语音信号中包含的至少一个音节。本专利技术实施例提供的中文语音信号处理方法,可以是针对待处理中文语音信号中每个音节的处理方法,也可以是针对待处理中文语音信号中部分音节的处理方法。因此,需要将连续的待处理中文语音信号进行音节切分,从而获得该待处理中文语音信号包括的至少一个音节,以便于后续处理。在本实施例中,可以利用以下方式中的任意一种来确定一个待处理中文语音信号方式一、将设定时长内接收到的中文语音信号作为待处理中文语音信号。在这种确定待处理的中文语音信号的方式下,可以通过选择适当的设定时长,保证中文语音信号的实时处理,使得感音性耳聋患者可以及时获得声调增强之后的中文语音信息。该设定时间越短,越利于耳聋患者及时的接收到调整后的中文语音信息。方式二、对已接收到的中文语音信号进行端点检测,将检测出的每一段中文语音信号依次作为待处理中文语音信号。在通过端点检测方式来确定待处理中文语音信号时,确定出的待处理中文语音信号中去除了由于说话的间歇等原因形成的静音信号,从而可以仅对已接收到的中文语音信号中的有效语音信号进行处理,提高对中文语音信号的处理速度。中文语音信号可以是通过麦克风等声音输入设备接收,并经过模拟/数字(A/D)转换设备转换后得到的数字信号。步骤102、确定切分得到的至少一个音节中每个音节对应的基频曲线。中文语音中声调的变化在声学层面上的表现为基频的变化,也即基频曲线。因此,为了对中文语音的声调进行增强,以提高 感音性耳聋患者对中文语音声调的识别率,可以对中文语音信号的基频曲线进行处理。本步骤中,可以针对切分得到的每个音节,确定该音节在每个采样时刻的基频,根据所述每个采样时刻的基频确定该音节对应的基频曲线。具体的,由于切分得到的每个音节对应的时间长度可能不同,因此,可以对切分得到的每个音节对应的时间长度进行归一化处理,并确定每个音节对应的基频曲线。步骤103、增大每个基频曲线的斜率。在本实施例中,可以通过增大基频曲线的斜率的方法来强调音节的声调特征。较优的,增大一个基频曲线的斜率可以为增大一个基频曲线的斜率和平均值,所述平均值是指该基频曲线在每个采样时刻的基频的平均值。具体的,可以通过以下公式,增大一个基频曲线的斜率FOnew (n) =CX (FOorigin (n) -FOmean)其中,η为正整数;F0new(n)表示增大后的基频曲线在第η个采样时刻的基频;FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频;Η)_η表示增大前的基频曲线的平均值;C表示斜率调整参数,且C大于I。具体的,可以通过以下公式,增大一本文档来自技高网...

【技术保护点】
一种中文语音信号处理方法,所述方法包括:对待处理中文语音信号进行音节切分,得到该待处理中文语音信号包含的至少一个音节;确定所述至少一个音节中每个音节对应的基频曲线;增大所述基频曲线的斜率;合成所述斜率增大后的基频曲线对应的音节。

【技术特征摘要】
1.一种中文语音信号处理方法,所述方法包括 对待处理中文语音信号进行音节切分,得到该待处理中文语音信号包含的至少一个音节; 确定所述至少一个音节中每个音节对应的基频曲线; 增大所述基频曲线的斜率; 合成所述斜率增大后的基频曲线对应的音节。2.如权利要求1所述的方法,其中,所述方法适用于助听设备; 所述合成所述斜率增大后的基频曲线对应的音节之后,所述方法进一步包括 确定合成的每个音节与所述至少一个音节中每个音节的对应关系; 按照所述至少一个音节中每个音节在所述待处理中文语音信号中的先后顺序,依次输出所述至少一个音节中每个音节对应的合成后的音节。3.如权利要求1所述的方法,其中,在所述对待处理中文语音信号进行音节切分之前,所述方法进一步包括 将设定时长内接收到的中文语音信号作为所述待处理中文语音信号;或者对已接收到的中文语音信号进行端点检测,将检测出的每一段中文语音信号依次作为所述待处理中文语音信号。4.如权利要求1所述的方法,其中,所述确定所述至少一个音节中每个音节对应的基频曲线,包括 针对所述至少一个音节中的每个音节,获得该音节在每个采样时刻的基频; 利用获得的每个采样时刻的基频确定该音节对应的基频曲线。5.如权利要求4所述的方法,其中,所述增大所述基频曲线的斜率,具体包括增大所述基频曲线的斜率和平均值,所述平均值是指该基频曲线在所述每个采样时刻的基频的平均值。6.如权利要求4所述的方法,其中,所述增大所述基频曲线的斜率,包括 对于所述基频曲线中的每一个基频曲线,通过以下公式增大该基频曲线的斜率FOnew(n) = CX (FOorigin(n)-FOmeJ 其中, η为正整数; FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频; FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频; Η)_η表示增大前的基频曲线的平均值; C表示斜率调整参数,且C大于I。7.如权利要求5所述的方法,其中,所述增大所述基频曲线的斜率和平均值,包括 对于所述基频曲线中的每一个基频曲线,通过以下公式增大该基频曲线的斜率和平均值FOnew(n) = CX (FOorigin(n)-FOmeJ+ (1+M) XFOmean其中, η为正整数; FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频;FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频; Η)_η表示增大前的基频曲线的平均值; C表示斜率调整参数,且C大于I ; M表示平均值调整参数,且M大于O。8.如权利要求1至7中任一项所述的方法,其中, 在所述增大所述基频曲线的斜率之前,所述方法进一步包括确定所述至少一个音节中每个音节的声调种类; 所述...

【专利技术属性】
技术研发人员:杨晨蔡莲红周卫
申请(专利权)人:西门子公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1