【技术实现步骤摘要】
语音识别方法、装置、设备、存储介质及空调
本申请涉及人机交互
,尤其涉及一种语音识别方法、装置、设备、存储介质及空调。
技术介绍
随着科学技术的发展,人与机器之间的交互方式也越来越多样化,其中,现在应用较为广泛的就是机器通过识别人的语音来进行人机交互。由于语言是由非常多种的方言构成,而对于单一方言来说,每个人的口音也会各不相同,因此,现有的语音识别技术在识别有口音的语音时,特别在方言复杂的偏远地区,识别率难以达到理想状态。
技术实现思路
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种语音识别方法、装置、设备、存储介质及空调。根据本申请的第一方面,提供一种语音识别方法,包括:获取语音信息;所述语音信息包括口音;将所述语音信息发送给预设的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。可选的,所述目标语音识别模型包括标准口音推断模型和目标口音推断模型;所述由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息,包括:将所述语音信息发送给预先训练得到的标准口音推断模型和预先训练得到的目标口音推断模型,分别对应得到所述语音信息的第一文本信息和第二文本信息;所述目标口音推断模型识别的口音与目标口音相匹配,所述目标口音为设备的地理位置使用的口音;分别确定所述第一文本信息与所述语音信息 ...
【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n获取语音信息;所述语音信息包括口音;/n将所述语音信息发送给预设的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;/n由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。/n
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取语音信息;所述语音信息包括口音;
将所述语音信息发送给预设的目标语音识别模型;所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;
由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。
2.根据权利要求1所述的方法,其特征在于,所述目标语音识别模型包括标准口音推断模型和目标口音推断模型;
所述由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息,包括:
将所述语音信息发送给预先训练得到的标准口音推断模型和预先训练得到的目标口音推断模型,分别对应得到所述语音信息的第一文本信息和第二文本信息;所述目标口音推断模型识别的口音与目标口音相匹配,所述目标口音为设备的地理位置使用的口音;
分别确定所述第一文本信息与所述语音信息的第一匹配度和所述第二文本信息与所述语音信息的第二匹配度;
输出所述第一匹配度和所述第二匹配度中匹配度较高的匹配度对应的文本信息。
3.根据权利要求2所述的方法,其特征在于,所述输出所述第一匹配度和所述第二匹配度中匹配度较高的匹配度对应的文本信息,包括:
当所述第一匹配度与所述第二匹配度均低于预设值时,将所述语音信息上传到服务器,以使所述服务器根据所述语音信息匹配最佳口音推断模型;
从所述服务器中获取所述最佳口音推断模型;
将所述语音信息发送给所述最佳口音推断模型;
由所述最佳口音推断模型识别所述语音信息得到所述语音信息的文本信息。
4.根据权利要求2所述的方法,其特征在于,还包括:
接收用户发出的同一关键词的标准口音信息和目标口音信息;
将所述标准口音信息发送给预先训练得到的标准口音推断模型,得到所述标准口音信息的文本信息;
将所述标准口音信息的文本信息设置为所述目标口音信息对应的文本信息;
获取目标地理位置;
由聚类算法对相同关键词的所述方言口音语音信息进行音素的比较和聚类,并根据所述方言口音语音信息对应的所述目标地理位置形成方言边界,进而形成口音地图。
5.根据权利要求4所述的方法,其特征在于,所述目标口音推断模型的训练过程包括:
获取所述目标口音信息、与所述目标口音信息对应的所述文本信息;
以所述目标口音信息和所述目标口音信息对应的文本信息作为训练样本,训练预先建立的深度学习模型,得到所述目标口音推断模型。
6.根据权利要求4所述的方法,其特征在于,所述获取目标地理位置,包括:
获取设备所在的目标地理位置;
或,
获取用户输入的目标地理位置。
7.根据权利要求6所述的方法,其特征在于,所述获取设备所在的目标地理位置包括:
获取与所述设备相连的邻近的移动终端地理位置作为所述目标地理位置。
8.一种语音识别装置,其特征在于,包括:
获取模块,用于获取语音信息;所述语音信息包括口音;
发送模块,用于所述目标语音识别模型识别的口音与目标口音相匹配,所述目标口音为设备所处地理位置使用的口音;
识别模块,用于由所述目标语音识别模型识别所述语音信息,得到所述语音信息的文本信息。
9.根据权利要求8所述的装置,...
【专利技术属性】
技术研发人员:刘文峰,
申请(专利权)人:珠海格力电器股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。