一种听障人群的语音辨识方法技术

技术编号:7296592 阅读:256 留言:0更新日期:2012-04-26 14:19
一种听障人群的语音辨识方法,包括以下步骤:第一,利用麦克风采集谈话者的语音信号并通过音频放大器进行信号放大;第二,放大后的语音信号利用微处理器完成信号的模数转换A/D、信号的语音处理、查询区位码并确设定皮肤刺激方案,将处理后的数字信号由数模转换器D/A转换后输出;第三,通过输出级信号处理模块的升压装置对D/A转换后的信号进行后级升压,利用平面电极完成对听障人群皮肤的刺激,设定刺激级别,听障用户在感受到特定数字串刺激后,可将该刺激辨识成数字信息,同时依据该数字信息来确定对话者的话语内容,内容简单,记忆过程容易,将复杂的语音辨识过程借助于微处理器完成,使听障人群对语音的辨识更为简单、有效。

【技术实现步骤摘要】

本专利技术属于语音辨识
,特别涉及一种语音辨识方法,尤其适用于听障人群。
技术介绍
据《首届国际听力障碍预防与康复大会》中的报告资料显示,当今世界,由于疾病、 遗传、耳毒性药物、噪声、意外事故以及人口老龄化的影响,人类面临的听力残疾风险增加, 听力障碍的人数不断上升,全球有2. 78亿人双耳存在中重度听力损伤,其中80%生活在发展中国家。听力障碍影响了人们的正常生活,给许多家庭带来了痛苦与贫困。听力障碍不仅成为全球性的公共卫生问题,也日益成为严重的社会问题。由于传统助听器是利用麦克风将声音信号转换成电信号并且放大,然后再把放大的声音传送给人的耳朵。这种方法需要依赖人体残余听力,并未从根本上解决听力障碍人群的听力问题。专利号为2004100^^65. 5的专利技术专利公开了一种变压式皮肤听声器,根据生物学的听觉原理,利用电子与声学技术模仿人体的听觉器官,提供了便于聋 人使用的皮肤听声器。该专利技术是将外部声音信号转换成电流信号,并将电流震荡信号通过皮肤传给大脑,使得听障用户能够感觉到刺激信号,但并未解决语音辨识的问题。专利号为200910219078. 1的专利技术专利公开了一种“多通道阵列式皮肤听声器”, 提供了一种利用多通道带通滤波及功率放大电路连接升压阵列装置,驱动平面电极阵列刺激皮肤不同位置的方式,使皮肤具备语音分辨能力。该专利技术需将复杂的语音还原为多路相对单纯的音频信号,并通过不同频率信号刺激人体不同位置的方式实现语音辨析。该过程需要听障用户经过长期的语言条件反射,反复训练后才能完成各种语音信号所产生不同刺激的记忆。因此,所需记忆的刺激种类较多,形成条件反射所需时间较长,使得语音辨识过程复杂,困难。
技术实现思路
为了克服上述现有技术的不足,本专利技术的目的在于提供,通过微处理器将所接收到的语音信息转换成汉字信息,并结合汉字区位码表转换成 0 9的数字信息,依据区位码以及使用者设置的最大刺激强度或默认强度来确定特定的皮肤刺激方案,进而实现听障人群对语音的辨识。本专利技术所需记忆的内容简单,记忆过程容易,将复杂的语音辨识过程借助于微处理器完成,使听障人群对语音的辨识更为简单、有效。为了实现上述目的,本专利技术采用的技术方案是,包括以下步骤第一,采集语音信号并通过音频放大器进行预处理,具体做法是利用麦克风采集对话者的语音信号,并将采集到的信号经过音频放大器进行信号放大;第二,放大后的语音信号利用微处理器完成信号的模数转换A/D、信号的语音处理、查询区位码并通过使用者设置的最大刺激强度或默认强度确定皮肤刺激方案,将处理后的数字信号由数模转换器DAC转换后输出至升压模块,具体做法是微处理器中的模数转换器ADC对音频放大器放大后的语音信号进行转换,即将语音模拟信号转换为语音数字信号,经过模数转换器ADC转换后的语音数字信号进入语音信号处理器转化为汉字信息,再通过查询微处理器中设有的区位码表找出该汉字信息所对应的四位十进制的数字信息,通过对应的数字信息并依据使用者设置的最大刺激强度或默认强度确定皮肤刺激方案,刺激方案中的刺激强度分为低、中、高三种级别,对三种级别进行特定组合后分别对应于0 9的数字信息,其中一个数字由1 3个刺激信号组成,每个数字之间有“短”间隔,一个汉字编码由4个数字组成,每个汉字编码之间有“长”间隔。最后,依语音信息确定的特定数字串经D/A转换器输出至升压模块;第三,通过输出级信号处理模块完成对模拟信号的升压并通过电极对皮肤产生刺激, 具体做法是通过输出级信号处理模块的升压装置将D/A转换后的信号进行后级升压,利用平面电极完成对听障人群皮肤的刺激。预先,听障用户可以依据自己的承受能力调节旋钮,设定刺激强度级别。听障用户感受到特定数字串刺激后,可将该刺激辨识成数字信息,同时依据该数字信息确定对话者的话语内容。平时训练时,听障用户可利用掌上电脑或区位字典查询区位码表,经反复练习即可达到辨识语音的最佳效果。本专利技术的有益效果是1)所确定的皮肤刺激方案,将产生高、中、低级别的刺激,通过特定组合对应于0 9的数字信息,使得记忆内容简洁,记忆过程较为容易,记忆效果比较显著。2)语音的辨识借助于微处理器,听障人群可以自行利用掌上电脑或区位字典查询区位码表,辨识谈话者说话的语音内容,使听障人群对语音的辨识更为简单、有效。本专利技术利用微处理器对采集到的语音信号进行处理,其中对于确定皮肤的刺激方案是通过查询汉字所对应的区位码,获取四位十进制数字信息;并将刺激分为低、中、高的三个级别,对三种级别进行组合后分别对应于O 9的数字信息,一个数字由1 3个刺激信号组成,每个数字之间有“短”间隔,一个汉字编码由4个数字组成,每个汉字编码之间有 “长”间隔,听障人群只需理解刺激方案及识别0 9的十个数字,即可识别汉字,在实际训练中,听障人群可以自行利用掌上电脑或区位字典查询区位码表,达到辨识语音的效果。由于本专利技术不依赖人体残余听力,并将复杂的语音辨识过程交给微处理器完成,具有所需记忆的内容简单,记忆过程容易,使听障人群对语音的辨识更为简单、有效的特点。附图说明图1为本专利技术的实施例的示意图。图2为本专利技术皮肤刺激方案图。图3为本专利技术语音辨识过程示意图。具体实施方式下面结合附图和实施例对本专利技术的技术方案及思路作进一步的描述。 实施例下面以对话者所述的一句“大家好”为例对本专利技术作进一步详细说明。参见图1、2、3,,包括以下步骤 第一,采集语音信号并通过音频放大器1进行预处理,具体做法是利用麦克风4采集谈话者的语音信号,将采集到的语音信号经过语音信号采集及预处理模块1的音频放大器5进行初级放大;第二,放大后的语音信号利用微处理器完成信号的模数转换A/D、信号的语音处理、查询区位码并依据使用者设置的最大刺激强度或默认强度来确定特定的皮肤刺激方案,将处理后的数字信号由数模转换器D/A转换后输出至升压模块,具体做法是微处理器2中的模数转换器ADC6对音频放大器5放大后的语音信号进行转换,即将语音模拟信号转换为语音数字信号,经过模数转换器ADC6转换后的语音数字信号进入语音信号处理器7转化为汉字信息,再通过查询微处理器2中设有的区位码表11找出汉字信息对应的四位十进制的数字信息,通过对应的数字信息并依据使用者设置的最大刺激强度或默认强度确定特定的皮肤刺激方案,刺激方案分为低、中、高的三个级别,其中,用户可以承受的最大刺激确定为高级,将该刺激的2/3确定为中级,1/3确定为低级,对三种级别进行组合后分别对应于0 9的数字信息,一个数字由1 3个刺激信号组成,每个数字之间有 “短”间隔,一个汉字编码由4个数字组成,每个汉字编码之间有“长”间隔。本例中“大家好”所对应的区位码分别是“2083”,“观50”,1635”,所对应的皮肤 .刺激数卞 Φ码为“ W-S-^S-VW--W-VS-厶-S--νν- ν-ννν-Δ ”,其中“_” 为短间隔,“_ _”为长间隔,微处理器2将所对应的数字信号Dmax确定为高级,2/3DmaX为中级,l/3Dmax为低级,此信号在使用者调节旋钮,并预先设定刺激强度时,由微处理器2自动记录并保存, 该数字信号在经过D/A8转换后输出不同程度的模拟信号,其中Amax为高级,2/3AmaX为中级,l/3Amax为低级;第三,通过输本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:张开生高明星李志健张攀峰
申请(专利权)人:陕西科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术