语音识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号：20727831 阅读：31 留言：0更新日期：2019-03-30 18:29

本发明专利技术公开了一种语音识别方法，所述方法包括：侦听用户发出的语音信息；对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令；采集用户周围环境的背景音；根据预存的背景音模型对所述背景音进行识别，并根据识别结果确定用户所处位置；将所述语音指令和位置信息结合，形成最终识别结果并输出。本发明专利技术还同时公开了一种语音识别装置及计算机可读存储介质。本发明专利技术可提升智能终端设备的语音识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置及计算机可读存储介质
本专利技术涉及语音识别领域，尤其涉及一种语音识别方法、装置及计算机可读存储介质。
技术介绍
随着科技的发展和计算机技术的进步，语音识别技术已然运用到生活和工业等各大领域，现有技术存在多种用来实现人机交互的语音识别方法或装置，为人类社会的经济发展做出了巨大贡献。然而，现有的语音识别技术一般仅能识别正常人的发音，当用户的发音不准确或者存在语言障碍时，现有的语音识别技术很难识别或者识别不准确。以老人为例：随着年龄的增长，一些语言方面的疾病在老人人群中处于高发状态，例如失语症等。失语症患者可能在说话、阅读，或书写上，有语言表达能力的障碍，但是智力并不会受到失语症的影响。现有的语音识别技术就难以对患失语症的人群进行语音识别，或者识别准确性会大大降低，因此相关技术难以应用，例如，在将语音识别技术应用到陪伴机器人时，由于难以对这类语音进行识别，陪伴机器人难以真正发挥其作用。有鉴于此，有必要提供一种语音识别技术，以提升语音识别的准确率，扩展语音识别技术的应用范围。
技术实现思路
本专利技术的主要目的在于提供一种语音识别方法，旨在提升语音识别的准确率，扩展语音识别技术的应用范围。为了实现上述目的，本专利技术提供一种语音识别方法，所述方法包括：侦听用户发出的语音信息；对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令；采集用户周围环境的背景音；根据预存的背景音模型对所述背景音进行识别，并根据识别结果确定用户所处位置；将所述语音指令和位置信息结合，形成最终识别结果并输出。优选地，所述对所述语音信息进行去噪处理并根据预存的语音模型...

【技术保护点】
1.一种语音识别方法，其特征在于，所述方法包括：侦听用户发出的语音信息；对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令；采集用户周围环境的背景音；根据预存的背景音模型对所述背景音进行识别，并根据识别结果确定用户所处位置；将所述语音指令和位置信息结合，形成最终识别结果并输出。

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：侦听用户发出的语音信息；对所述语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令；采集用户周围环境的背景音；根据预存的背景音模型对所述背景音进行识别，并根据识别结果确定用户所处位置；将所述语音指令和位置信息结合，形成最终识别结果并输出。2.根据权利要求1所述的方法，其特征在于，所述对语音信息进行去噪处理并根据预存的语音模型识别用户的语音指令包括：获取用户语音信息中的爆破音、摩擦音和鼻音特征参数并将其与相应的预设模型进行比较；在所述爆破音、摩擦音或鼻音的震幅小于预设范围时，对其进行增强处理。3.根据权利要求1或2所述的方法，其特征在于，还包括：根据采集到的多个预定时刻的语音信息线性分析用户的语音变化，将分析结果形成新的语音模型并存储。4.根据权利要求3所述的方法，其特征在于，所述根据预存的背景音模型对所述背景音进行识别，并根据识别结果确定用户所处位置包括：将采集到的预置音源发出的声音及环境中的背景音分别与背景音模型进行比对，根据比对结果确定用户所处位置。5.根据权利要求4所述的方法，其特征在于，还包括：通过图文形式显示所述识别结果供用户选择或确认，并在用户选择或确认后将所述识别结果输出至外部设备，和/或，通过语音向用户广播所述识别结果并接收用户的反...

【专利技术属性】
技术研发人员：袁晖，
申请(专利权)人：深圳市科迈爱康科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人