【技术实现步骤摘要】
带自定义的智能耳蜗声音处理系统和方法
本专利技术属于信号处理领域,特别涉及一种带自定义的智能耳蜗声音处理系统和方法。
技术介绍
人工耳蜗是目前市场上唯一一种可以有效地让重度或极重度耳聋患者恢复听力的医疗器械。一般的人工耳蜗的工作原理是将麦克风采集的声音信号,经过信号处理单元,将声音信号转为刺激编码发送给植入体,植入体按照刺激编码,通过微电极刺激听神经,从而使植入者恢复听力。环境往往存在很多的噪声,会严重影响辅听设备用户的听声感受。通常的做法是使用降噪或者语音增强手段对声音进行处理。然而,单一的声音处理算法或者某一处理算法的单一参数配置难以应付复杂多变的声音环境。因此,这类设备大都配有多种声音处理方法以应对不同的情况。在早期,在何种情况下使用何种方法需要用户手动选择,随着人工智能技术的不断发展,现在出现了自动选择处理方法的环境声感知系统。实验表明,相比自主选择,系统自动选择的处理方法更能提高用户的言语辨识能力。但是,人工耳蜗这类设备,由于每个患者的情况不同,具体说是每个患者耳蜗内残留的听神经情况不同;同时,植入体电极插入耳蜗的 ...
【技术保护点】
1.一种带自定义的智能耳蜗声音处理系统,其特征在于,包括智能控制模块、声音处理模块、声音精准优化模块、前麦克风音频采集模块和后麦克风音频采集模块,其中,智能控制模块与声音处理模块、声音精准优化模块、前麦克风音频采集模块和后麦克风音频采集模块分别连接,声音处理模块还与声音精准优化模块连接,前麦克风音频采集模块和后麦克风音频采集模块还与声音处理模块连接,智能控制模块对环境声进行监听和识别,根据识别的结果,实时调整声音处理模块的参数配置;声音处理模块对声音信号进行处理,包括降噪和语音增强;声音精准优化模块提供精准的个性化处理及优化,可生成自定义的声音处理策略;前麦克风音频采集模块 ...
【技术特征摘要】
1.一种带自定义的智能耳蜗声音处理系统,其特征在于,包括智能控制模块、声音处理模块、声音精准优化模块、前麦克风音频采集模块和后麦克风音频采集模块,其中,智能控制模块与声音处理模块、声音精准优化模块、前麦克风音频采集模块和后麦克风音频采集模块分别连接,声音处理模块还与声音精准优化模块连接,前麦克风音频采集模块和后麦克风音频采集模块还与声音处理模块连接,智能控制模块对环境声进行监听和识别,根据识别的结果,实时调整声音处理模块的参数配置;声音处理模块对声音信号进行处理,包括降噪和语音增强;声音精准优化模块提供精准的个性化处理及优化,可生成自定义的声音处理策略;前麦克风音频采集模块和后麦克风音频采集模块分别设置在智能耳蜗体外机的前侧和后侧,对外界声音进行采集。
2.根据权利要求1所述的带自定义的智能耳蜗声音处理系统,其特征在于,所述智能控制模块包括音频预处理模块、音频成分检测模块和音频成分综合分析决策模块,其中,音频预处理模块包括能量检测模块和音频信号特征分析模块,所述能量检测模块通过监测能量的方式,从声音信号流里检测静音期,如处于静音期,则音频成分检测模块将其判定为安静环境,同时避开音频信号特征分析模块的处理和音频成分检测模块的判定,直接传送给音频成分综合分析模块进行统计分析;如非静音期,则将音频信号送给音频信号特征分析模块,将信号的物理特征提取出来并进行统计分析,形成特征集合,将该特征集合提供给音频成分检测模块,计算上述特征值时,以4ms为一个帧,统计计算0.5s即125帧特征值的均值和方差;
音频成分检测模块对特征集合进行分析,识别出该特征集合表征的音频信号包含的成分或者属于的环境,将分类结果传递给音频成分综合分析决策模块;
音频成分综合分析决策模块对环境向量进行统计分析,调控声音处理模块的处理策略,包括状态反馈模块、统计分析模块和决策输出模块;状态反馈模块将环境向量与一个状态转移矩阵相乘,得到一个通过先验概率加权评估后的环境向量,传递给统计分析模块,状态转移矩阵里的每一个元素代表了一类声音转换到另一类声音的概率,其值越大,代表可能性越高;统计分析模块对一段时间内的环境向量进行统计,将统计结果超过一定阈值的最多两种声音类别作音频成分的最终决定,发送给决策输出模块,上述一段时间为6-15s;决策输出模块根据统计分析模块的对音频成分的最终判定,控制声音处理模块的处理策略,包括开启声音处理算法以及选择算法的参数配置;
所述声音处理模块在智能控制模块的调控下对声音进行降噪和语音增强的处理,包括双麦克风降噪模块、单麦克风降噪模块、语音增强模块和参数配置模块,声音信号被前麦克风音频采集模块和后麦克风音频采集模块采集之后,依次经过双麦克风降噪、单麦克风降噪和语音增强的处理;
所述单麦克风降噪模块通过噪声估计和噪声消除,提高语音信号的信噪比;
所述双麦克风降噪模块处理不同方位的声源发出的声音,到达一前一后两个麦克风的时间延时不同,反向判断目标声源以及噪声源的方向,进行延时相加,以及差分麦克风阵列中分别控制目标声源及噪声源的增益;
所述语音增强模块通过改变时域输出的幅度,拟合汉语4声调的基频,提高用户对汉语声调的感知能力;
所述参数配置模块包括双麦克风降噪参数配置表、单麦克风降噪参数配置表和语音增强参数配置表,每个配置表均包括一组默认参数配置作为预设值、一组可选参数配置作为备用选项和4组自定义参数配置,其中可选参数配置和自定义参数配置根据户需求可个性化设置,可选参数配置在默认参数的基础上,根据实际听声感受进行微调;自定义参数配置为匹配自定义环境检测而设置的模块,当检测到自定义的声音环境时,使用与之对应的自定义参数配置;语音增强参数配置表中包括一组13阶低通滤波器的系数、平滑因子、增益以及增益变化的步长;单麦克风降噪参数配置表中包括两个常数项和两个平滑因子;双麦克风降噪参数配置表中包括一个侧向的增益因子和后向三个不同角度的增益因子;
所述声音精准优化模块包括手机应用模块、云端服务器和用户定制服务单元,其中,手机应用模块包括用户自定义引导单元、服务请求单元和服务反馈单元,配置手机应用模块首先通过手机应用模块控制耳蜗采集环境声并通过音频信号特征分析模块提取其特征值,并将特征值和音频发送给云端服务器等待处理,然后通过手机应用模块递交服务请求,云端服务器收到请求后,启动用户定制服务单元,对上传的数据进行分析和处理,训练自定义环境检测单元的参数,并调整与之匹配的声音处理模块的自定义参数配置,云端服务器将训练和调试好的参数,下载到手机,再通过手机应用模块的服务反馈单元将参数部署到耳蜗中;所述用户自定义引导单元通过音频信号特征分析模块将所需自定义的声音环境的音频信号特征进行提取,并将特征值发送到云端服务器进行存储;
所述服务请求单元将系统信息及用户信息提供给云端服务器并发送给用户定制服务单元;
所述云端服务器存储和管理用户数据和信息;
所述用户定制服务单元根据用户递交的请求对数据进行处理,然后通过数据训练自定义环境检测单元的参数,并调整自定义参数配置,待完成参数的训练和调试后,通过云端服务器下传到用户的手机端;
所述服务反馈单元在接收到云端服务器传来的配置文件后,将配置部署到声音处理模块中。
3.根据权利要求2所述的带自定义的智能耳蜗声音处理系统,其特征在于,所述特征集合包括谱质心、谱熵、不同子频段划分的子带能量率、单帧谱通量、多帧谱通量和频谱能量互相关。
4.根据权利要求2所述的带自定义的智能耳蜗声音处理系统,其特征在于,所述音频成分检测模块包括至少10个预设检测模块和4个自定义环境检测单元,10个预设检测模块包含言语成分检测单元、耳语成分检测单元、安静环境检测单元、车内噪声环境检测单元、空调环境检测单元单元、言语噪声环境检测单元、街道环境检测单元、雨噪环境检测单元、风噪环境检测单元和强噪声环境检测单元,每个检测单元均包括基于二分类神经网络模型的分类器,模型参数通过包含相应声音的音频数据库训练得出,该音频数据库包括言语、耳语、车内噪声、空调噪声、言语噪声、街道噪声、雨噪、风噪、强噪,每个二分类器均采用一对多的分类模式,即在训练言语成分检测模块的分类器时,将数据库中的全部音频划分为言语声和非言语声,如是训练耳语成分检测单元的分类器时,将数据库中的全部音频划分为耳语声和非耳语声,以此类推,在均衡了两类数据样本之后,对各自的分类器进行训练;自定义检测单元用于检测用户自定义的声音或环境类别,所有检测单元的输出结果组成一个一维的向量,即环境向量,提供给音频成分综合分析决策模块,环境向量中的每一个元素是归一后从0到1之间的小数,值越大代表音频中包含该元素对应的声音类别的可能性越大。
5.一种采用权利要求1-4之一的系统的带自定义的智能耳蜗声音处理系统的单麦克风降噪方法,其特征在于,包括以下步骤:
所述单麦克风降噪模块进行噪声估计和噪声消除,首先...
【专利技术属性】
技术研发人员:韩彦,黄穗,孙晓安,
申请(专利权)人:浙江诺尔康神经电子科技股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。