语音识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号:20727831 阅读:31 留言:0更新日期:2019-03-30 18:29
本发明专利技术公开了一种语音识别方法,所述方法包括:侦听用户发出的语音信息;对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令;采集用户周围环境的背景音;根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置;将所述语音指令和位置信息结合,形成最终识别结果并输出。本发明专利技术还同时公开了一种语音识别装置及计算机可读存储介质。本发明专利技术可提升智能终端设备的语音识别准确率。

【技术实现步骤摘要】
语音识别方法、装置及计算机可读存储介质
本专利技术涉及语音识别领域,尤其涉及一种语音识别方法、装置及计算机可读存储介质。
技术介绍
随着科技的发展和计算机技术的进步,语音识别技术已然运用到生活和工业等各大领域,现有技术存在多种用来实现人机交互的语音识别方法或装置,为人类社会的经济发展做出了巨大贡献。然而,现有的语音识别技术一般仅能识别正常人的发音,当用户的发音不准确或者存在语言障碍时,现有的语音识别技术很难识别或者识别不准确。以老人为例:随着年龄的增长,一些语言方面的疾病在老人人群中处于高发状态,例如失语症等。失语症患者可能在说话、阅读,或书写上,有语言表达能力的障碍,但是智力并不会受到失语症的影响。现有的语音识别技术就难以对患失语症的人群进行语音识别,或者识别准确性会大大降低,因此相关技术难以应用,例如,在将语音识别技术应用到陪伴机器人时,由于难以对这类语音进行识别,陪伴机器人难以真正发挥其作用。有鉴于此,有必要提供一种语音识别技术,以提升语音识别的准确率,扩展语音识别技术的应用范围。
技术实现思路
本专利技术的主要目的在于提供一种语音识别方法,旨在提升语音识别的准确率,扩展语音识别技术的应用范围。为了实现上述目的,本专利技术提供一种语音识别方法,所述方法包括:侦听用户发出的语音信息;对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令;采集用户周围环境的背景音;根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置;将所述语音指令和位置信息结合,形成最终识别结果并输出。优选地,所述对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令包括:获取用户语音信息中的爆破音、摩擦音和鼻音特征参数并将其与相应的预设模型进行比较;在所述爆破音、摩擦音或鼻音的震幅小于预设范围时,对其进行增强处理。优选地,上述方法还包括:根据采集到的多个预定时刻的语音信息线性分析用户的语音变化,将分析结果形成新的语音模型并存储。优选地,所述根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置包括:将采集到的预置音源发出的声音及环境中的背景音分别与背景音模型进行比对,根据比对结果确定用户所处位置。优选地,上述方法还可包括:通过图文形式显示所述识别结果供用户选择或确认,并在用户选择或确认后将所述识别结果输出至外部设备,和/或,通过语音向用户广播所述识别结果并接收用户的反馈信息。本专利技术还提供一种语音识别装置,其包括:语音采集模块,用于侦听用户发出的语音信息;第一处理模块,用于对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令;背景音侦听模块,用于采集用户周围环境的背景音;第二处理模块,用于根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置;输出模块,用于将所述语音指令和位置信息结合,形成最终识别结果并输出。优选地,所述语音采集模块用于:获取用户语音信息中的爆破音、摩擦音和鼻音特征参数并将其与相应的预设模型进行比较;在所述爆破音、摩擦音或鼻音的震幅小于预设范围时,对其进行增强处理。优选地,上述装置还包括:更新模块,用于根据采集到的多个预定时刻的语音信息线性分析用户的语音变化,将分析结果形成新的语音模型并存储。本专利技术另提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令的计算机程序被处理器执行时实现前述的语音识别方法。本专利技术通过提取用户的语音指令和背景音,提取用户的语音指令并结合对环境中背景音的识别,当用户发音不够完全或者不够清楚时,借助环境的识别结果来判断用户的真实意图,从而提升语音识别准确率。附图说明图1为本专利技术实施例语音识别方法的流程示意图;图2为本专利技术实施例语音识别方法中将用户的语音信息与语音模型进行比较,得到用户的语音指令的步骤流程示意图;图3为本专利技术实施例语音识别装置结构示意图;图4为本专利技术实施例语音识别装置第一处理模块和第二处理模块的结构示意图。具体实施方式本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参照图1,本专利技术提供一种语音识别方法,该方法包括:步骤S10,侦听用户发出的语音信息;本专利技术实施例中,可以在手机、平板或者机器人等智能设备设置语音侦听装置,采集用户发出的语音信息。步骤S20,对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令;当采集到语音信息时,通过语音芯片进行去噪处理,获取用户发出的语音指令。步骤S30,采集用户周围环境的背景音;在获得语音指令后,唤醒手机、平板或者机器人等智能设备中的第二个语音侦听装置,侦测并接收环境中的背景音。步骤S40,根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置;例如,通过语音芯片对背景音进行分析,根据声音的音量大小判断用户处于户外还是室内,进一步地的,还可以根据音量大小或者类型判断用户处于卧式、客厅还是厨房。步骤S50,将所述语音指令和位置信息结合,形成最终识别结果并输出。当语音指令和位置信息均明确时,给出识别结果并输出。本专利技术实施例中,当用户发音不够完全或者不够清楚时,借助环境的识别结果来判断用户的真实意图,从而提升语音识别准确率。以下是本专利技术的一个应用场景,借助该应用场景,可以进一步了解本专利技术语音识别的详细方案:场景一:老人借助机器人,只需说出“空调”或“打开空调”,就打开了卧室的空调。具体流程如下:步骤A:使用者向陪伴机器人发出语音命令;步骤B:陪伴机器人的第一声音接收装置接收到用户的语音信号;步骤C:陪伴机器人的微处理器分析得到第一识别结果:打开空调,同时唤醒第二声音接收装置,接收来自周围环境的背景音信号;步骤D:陪伴机器人的微处理器分析得到第二识别结果:卧室;步骤E:陪伴机器人的微处理综合分析得到最终识别结果:打开卧室的空调;步骤F:陪伴机器人的网络装置,按照存储装置的预设位置信息,向卧室的空调发出运行命令,令其开始启动、运行。本专利技术实施例中,在执行所有步骤之前还可包括:对用户的语音信息以及背景音进行训练并建模,形成语音模型和背景音模型并存储。本专利技术实施例中,采集发音困难或存在障碍人群的语音进行训练并建模,以便在应用时能正确识别用户发音。另外,采集室内室外的背景音并进行建模,以识别用户所处环境,例如,可在不同时段采集多个卧室环境的背景音并对其进行训练和建模并存储,用户在实际应用时即可提取背景音模型进行比对,从而确定用户所处环境。可以理解的是,前述对语音信息进行去噪处理以识别用户的语音指令的步骤包括:对接收到的语音信息进行去噪处理,得到用户的语音信息;将所述用户的语音信息与语音模型进行比较,得到用户的语音指令;前述根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置的步骤包括:对采集到的背景音进行去噪处理,根据去噪后的背景音确定用户所处位置,得到位置信息。考虑到一些环境的背景音模型可能极为相似或相同,还可预先在不同的环境设置用于识别环境的音源,通过语音采集模块进行实时采集,语音芯片将采集到的预置音源发出的声音及环境中的背景音分别与背景音模型进行比对,根据比对结果确定用户所处位置。例如,本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:侦听用户发出的语音信息;对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令;采集用户周围环境的背景音;根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置;将所述语音指令和位置信息结合,形成最终识别结果并输出。

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:侦听用户发出的语音信息;对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令;采集用户周围环境的背景音;根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置;将所述语音指令和位置信息结合,形成最终识别结果并输出。2.根据权利要求1所述的方法,其特征在于,所述对语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令包括:获取用户语音信息中的爆破音、摩擦音和鼻音特征参数并将其与相应的预设模型进行比较;在所述爆破音、摩擦音或鼻音的震幅小于预设范围时,对其进行增强处理。3.根据权利要求1或2所述的方法,其特征在于,还包括:根据采集到的多个预定时刻的语音信息线性分析用户的语音变化,将分析结果形成新的语音模型并存储。4.根据权利要求3所述的方法,其特征在于,所述根据预存的背景音模型对所述背景音进行识别,并根据识别结果确定用户所处位置包括:将采集到的预置音源发出的声音及环境中的背景音分别与背景音模型进行比对,根据比对结果确定用户所处位置。5.根据权利要求4所述的方法,其特征在于,还包括:通过图文形式显示所述识别结果供用户选择或确认,并在用户选择或确认后将所述识别结果输出至外部设备,和/或,通过语音向用户广播所述识别结果并接收用户的反...

【专利技术属性】
技术研发人员:袁晖
申请(专利权)人:深圳市科迈爱康科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1