一种视觉与语音结合的助听方法及系统技术方案

技术编号：24692795 阅读：48 留言：0更新日期：2020-06-27 11:44

本发明专利技术涉及一种助听技术领域，尤其涉及一种视觉与语音结合的助听方法及系统：S1，采用第一采集模块收集助听装置的佩戴者周围环境的语音信息；S2，采用第二采集模块获取佩戴者前方的图像信息；S3，处理模块判断佩戴者周围的说话人所在的方位信息；S4，处理模块对语音信息进行增强处理并进行语音识别，以获取与语音信息对应的文字内容；S5，采用助听装置接收语音信息，放大后播放给佩戴者；以及采用可视模块接收并显示文字内容，用于辅助佩戴者理解语音信息。有益效果在于：本发明专利技术中通过语音识别、图像识别和文字显示三者结合的方式来帮助听力障碍患者正常交流，并通过唇语识别来纠正传统的语音识别的错误，提高了在复杂环境下的语音识别的识别率。

A hearing aid method and system based on the combination of vision and voice

全部详细技术资料下载

【技术实现步骤摘要】
一种视觉与语音结合的助听方法及系统
本专利技术涉及一种助听
，尤其涉及一种视觉与语音结合的助听方法及系统。
技术介绍
听力障碍严重影响患者的生活，还可能会引发重度失眠、认知衰退、抑郁等极为严重的心理问题。据统计，全球65岁以上的老年人，约有1/3的人存在耳聋或者听力障碍。助听器对于听力损失者的听力改善可以起到一定的辅助作用，并且对听力损失的恢复也有极大的帮助。但是目前的助听器在嘈杂环境中，很难准确地判断与佩戴者对话的目标，与此同时助听器只能单方面的增大目标和其他语音信号，给佩戴者带来很强的不适感，如何帮助听力障碍患者更好的与其他人交流成为亟待解决问题。
技术实现思路
针对现有技术中出现的上述问题，现提供一种视觉与语音结合的助听方法及系统，其具体技术方案如下：本专利技术中涉及一种视觉与语音结合的助听方法，其中，所述助听方法包括以下步骤：步骤S1，采用一第一采集模块收集一助听装置的佩戴者周围环境的语音信息，并将所述语音信息发送至一处理模块；步骤S2，采用一第二采集模块获取所述佩戴者前方的图像信息，并将所述图像信息发送至所述处理模块；步骤S3，所述处理模块根据接收到的所述语音信息和所述图像信息，判断所述佩戴者周围的说话人所在的方位信息；步骤S4，所述处理模块对根据所述步骤S3中输出的所述方位信息所对应的所述语音信息进行增强处理，并对增强后的所述语音信息进行语音识别，以获取与所述语音信息对应的文字内容；步骤S5，采用所述助听装置接收所述步骤S4...

【技术保护点】
1.一种视觉与语音结合的助听方法，其特征在于，所述助听方法包括：/n步骤S1，采用一第一采集模块收集一助听装置的佩戴者周围环境的语音信息，并将所述语音信息发送至一处理模块；/n步骤S2，采用一第二采集模块获取所述佩戴者前方的图像信息，并将所述图像信息发送至所述处理模块；/n步骤S3，所述处理模块根据接收到的所述语音信息和所述图像信息，判断所述佩戴者周围的说话人所在的方位信息；/n步骤S4，所述处理模块对根据所述步骤S3中输出的所述方位信息所对应的所述语音信息进行增强处理，并对增强后的所述语音信息进行语音识别，以获取与所述语音信息对应的文字内容；/n步骤S5，采用所述助听装置接收所述步骤S4中输出的增强后的所述语音信息，放大后播放给所述佩戴者；以及/n采用一可视模块接收并显示所述步骤S4中输出的所述文字内容，用于辅助所述佩戴者理解所述语音信息。/n

【技术特征摘要】
1.一种视觉与语音结合的助听方法，其特征在于，所述助听方法包括：
步骤S1，采用一第一采集模块收集一助听装置的佩戴者周围环境的语音信息，并将所述语音信息发送至一处理模块；
步骤S2，采用一第二采集模块获取所述佩戴者前方的图像信息，并将所述图像信息发送至所述处理模块；
步骤S3，所述处理模块根据接收到的所述语音信息和所述图像信息，判断所述佩戴者周围的说话人所在的方位信息；
步骤S4，所述处理模块对根据所述步骤S3中输出的所述方位信息所对应的所述语音信息进行增强处理，并对增强后的所述语音信息进行语音识别，以获取与所述语音信息对应的文字内容；
步骤S5，采用所述助听装置接收所述步骤S4中输出的增强后的所述语音信息，放大后播放给所述佩戴者；以及
采用一可视模块接收并显示所述步骤S4中输出的所述文字内容，用于辅助所述佩戴者理解所述语音信息。

2.根据权利要求1所述视觉与语音结合的助听方法，其特征在于，所述第一采集模块采用多路麦克风实现。

3.根据权利要求1所述视觉与语音结合的助听方法，其特征在于，所述步骤S3包括：
步骤S31，所述处理模块根据接收到的所述语音信息判断所述语音信息的声源的位置；
步骤S32，所述处理模块根据接收到的所述图像信息判断所述佩戴者的前方是否存在所述说话人，
若是，则转向步骤S33；
若否，则转向步骤S35；
步骤S33，所述处理模块根据所述图像信息判断所述佩戴者的前方是否存在多个所述说话人，
若是，则转向步骤S34；
若否，则根据所述图像信息确定并输出所述说话人的所述方位信息，随后转向所述步骤S4；
步骤S34，所述处理模块根据所述图像信息，确定并输出位于所述佩戴者的前方的中轴线上且距离所述佩戴者最近的所述说话人的所述方位信息，随后转向所述步骤S4；
步骤S35，所述处理模块根据所述语音信息和所述图像信息综合确定并输出所述说话人的方位信息，随后转向所述步骤S4。

【专利技术属性】
技术研发人员：林峰，黄明飞，姚宏贵，
申请(专利权)人：开放智能机器上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人