语音识别方法、装置、设备、存储介质及空调制造方法及图纸

技术编号:24173611 阅读:24 留言:0更新日期:2020-05-16 03:48
本申请涉及一种语音识别方法、装置、设备、存储介质及空调,包括:获取语音信息;将语音信息发送给预先训练得到的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,目标口音为设备所处地理位置对应的口音;由目标语音识别模型识别语音信息,得到语音信息的文本信息。由于目标语音模型与上述地理位置使用的口音相匹配,因此该目标语音模型对方言口音的识别率较高,基于此,本申请的技术方案对方言口音具有较为理想的识别率。

【技术实现步骤摘要】
语音识别方法、装置、设备、存储介质及空调
本申请涉及人机交互
,尤其涉及一种语音识别方法、装置、设备、存储介质及空调。
技术介绍
随着科学技术的发展,人与机器之间的交互方式也越来越多样化,其中,现在应用较为广泛的就是机器通过识别人的语音来进行人机交互。由于语言是由非常多种的方言构成,而对于单一方言来说,每个人的口音也会各不相同,因此,现有的语音识别技术在识别有口音的语音时,特别在方言复杂的偏远地区,识别率难以达到理想状态。
技术实现思路
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种语音识别方法、装置、设备、存储介质及空调。根据本申请的第一方面,提供一种语音识别方法,包括:获取语音信息;所述语音信息包括口音;将所述语音信息发送给预设的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。可选的,所述目标语音识别模型包括标准口音推断模型和目标口音推断模型;所述由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息,包括:将所述语音信息发送给预先训练得到的标准口音推断模型和预先训练得到的目标口音推断模型,分别对应得到所述语音信息的第一文本信息和第二文本信息;所述目标口音推断模型识别的口音与目标口音相匹配,所述目标口音为设备的地理位置使用的口音;分别确定所述第一文本信息与所述语音信息的第一匹配度和所述第二文本信息与所述语音信息的第二匹配度;输出所述第一匹配度和所述第二匹配度中匹配度较高的匹配度对应的文本信息。可选的,所述输出所述第一匹配度和所述第二匹配度中匹配度较高的匹配度对应的文本信息,包括:当所述第一匹配度与所述第二匹配度均低于预设值时,将所述语音信息上传到服务器,以使所述服务器根据所述语音信息匹配最佳口音推断模型;从所述服务器中获取所述最佳口音推断模型;将所述语音信息发送给所述最佳口音推断模型;由所述最佳口音推断模型识别所述语音信息得到所述语音信息的文本信息。可选的,本方法还包括:接收用户发出的同一关键词的标准口音信息和目标口音信息;将所述标准口音信息发送给预先训练得到的标准口音推断模型,得到所述标准口音信息的文本信息;将所述标准口音信息的文本信息设置为所述目标口音信息对应的文本信息;获取目标地理位置;由聚类算法对相同关键词的所述方言口音语音信息进行音素的比较和聚类,并根据所述方言口音语音信息对应的所述目标地理位置形成方言边界,进而形成口音地图。可选的,所述目标口音推断模型的训练过程包括:获取所述目标口音信息、与所述目标口音信息对应的所述文本信息;以所述目标口音信息和所述目标口音信息对应的文本信息作为训练样本,训练预先建立的深度学习模型,得到所述目标口音推断模型。可选的,所述获取目标地理位置,包括:获取设备所在的目标地理位置;或,获取用户输入的目标地理位置。可选的,所述获取设备所在的目标地理位置包括:获取与所述设备相连的邻近的移动终端地理位置作为所述目标地理位置。根据本申请的第二方面,提供一种语音识别装置,包括:获取模块,用于获取语音信息;所述语音信息包括口音;发送模块,用于所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;识别模块,用于由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。可选的,所述目标语音识别模型包括标准口音推断模型和目标口音推断模型;所述识别模块包括:识别单元,用于将所述语音信息发送给预先训练得到的标准口音推断模型和预先训练得到的目标口音推断模型,分别对应得到所述语音信息的第一关键词和第二关键词;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备的地理位置使用的口音;匹配单元,用于分别确定所述第一文本信息与所述语音信息的第一匹配度和所述第二文本信息与所述语音信息的第二匹配度;输出单元,用于输出所述第一匹配度和所述第二匹配度中匹配度较高的匹配度对应的文本信息。可选的,所述输出单元包括:上传子单元,用于当所述第一匹配度与所述第二匹配度均低于预设值时,将所述语音信息上传到服务器,以使所述服务器根据所述语音信息匹配最佳口音推断模型;下载子单元,用于从所述服务器中获取所述最佳口音推断模型;发送子单元,用于将所述语音信息发送给所述最佳口音推断模型;识别子单元,用于由所述最佳口音推断模型识别所述语音信息得到所述语音信息的文本信息。可选的,还包括口音地图生成模块,所述口音地图生成模块包括:接收单元,用于接收用户发出的同一关键词的标准口音信息和目标口音信息;识别单元,用于将所述标准口音语音信息发送给预先训练得到的标准口音推断模型,得到所述标准口音信息的文本信息;设置单元,用于将所述标准口音信息的文本信息设置为所述目标口音信息对应的文本信息;第二获取单元,用于获取目标地理位置;生成单元,用于由聚类算法对相同关键词的所述方言口音语音信息进行音素的比较和聚类,并根据所述方言口音语音信息对应的所述目标地理位置形成方言边界,进而形成口音地图。可选的,还包括目标口音推断模型的训练模块,所述目标口音推断模型的训练模块包括:第一获取单元,用于获取目标口音信息、所述目标口音信息对应的文本信息;训练单元,用于以所述目标口音信息和所述目标口音信息对应的文本信息作为训练样本,训练预先建立的深度学习模型,得到所述目标口音推断模型。可选的,所述第二获取单元包括:第一获取子单元,用于获取设备所在的目标地理位置;或,第二获取子单元,用于获取用户输入的目标地理位置。可选的,所述第一获取子单元具体用于获取与所述设备相连的邻近的移动终端地理位置作为所述目标地理位置。根据本申请的第三方面,提供一种语音识别的设备,包括:处理器,以及与所述处理器相连接的存储器;所述存储器用于存储计算机程序,所述计算机程序至少用于执行如下所述的语音识别方法:获取语音信息;所述语音信息包括口音;将所述语音信息发送给预设的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。可选的,所述目标语音识别模型包括标准口音推断模型和目标口音推断模型;所述由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息,包括:将所述语音信息发送给预先训练得到的标准口音推断模型和预先训练得到的目标口音推断模型,分别对应得到所述语音信息本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n获取语音信息;所述语音信息包括口音;/n将所述语音信息发送给预设的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;/n由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取语音信息;所述语音信息包括口音;
将所述语音信息发送给预设的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;
由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。


2.根据权利要求1所述的方法,其特征在于,所述目标语音识别模型包括标准口音推断模型和目标口音推断模型;
所述由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息,包括:
将所述语音信息发送给预先训练得到的标准口音推断模型和预先训练得到的目标口音推断模型,分别对应得到所述语音信息的第一文本信息和第二文本信息;所述目标口音推断模型识别的口音与目标口音相匹配,所述目标口音为设备的地理位置使用的口音;
分别确定所述第一文本信息与所述语音信息的第一匹配度和所述第二文本信息与所述语音信息的第二匹配度;
输出所述第一匹配度和所述第二匹配度中匹配度较高的匹配度对应的文本信息。


3.根据权利要求2所述的方法,其特征在于,所述输出所述第一匹配度和所述第二匹配度中匹配度较高的匹配度对应的文本信息,包括:
当所述第一匹配度与所述第二匹配度均低于预设值时,将所述语音信息上传到服务器,以使所述服务器根据所述语音信息匹配最佳口音推断模型;
从所述服务器中获取所述最佳口音推断模型;
将所述语音信息发送给所述最佳口音推断模型;
由所述最佳口音推断模型识别所述语音信息得到所述语音信息的文本信息。


4.根据权利要求2所述的方法,其特征在于,还包括:
接收用户发出的同一关键词的标准口音信息和目标口音信息;
将所述标准口音信息发送给预先训练得到的标准口音推断模型,得到所述标准口音信息的文本信息;
将所述标准口音信息的文本信息设置为所述目标口音信息对应的文本信息;
获取目标地理位置;
由聚类算法对相同关键词的所述方言口音语音信息进行音素的比较和聚类,并根据所述方言口音语音信息对应的所述目标地理位置形成方言边界,进而形成口音地图。


5.根据权利要求4所述的方法,其特征在于,所述目标口音推断模型的训练过程包括:
获取所述目标口音信息、与所述目标口音信息对应的所述文本信息;
以所述目标口音信息和所述目标口音信息对应的文本信息作为训练样本,训练预先建立的深度学习模型,得到所述目标口音推断模型。


6.根据权利要求4所述的方法,其特征在于,所述获取目标地理位置,包括:
获取设备所在的目标地理位置;
或,
获取用户输入的目标地理位置。


7.根据权利要求6所述的方法,其特征在于,所述获取设备所在的目标地理位置包括:
获取与所述设备相连的邻近的移动终端地理位置作为所述目标地理位置。


8.一种语音识别装置,其特征在于,包括:
获取模块,用于获取语音信息;所述语音信息包括口音;
发送模块,用于所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;
识别模块,用于由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。


9.根据权利要求8所述的装置,...

【专利技术属性】
技术研发人员:刘文峰
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1