【技术实现步骤摘要】
语音控制方法、装置、设备及介质
[0001]本专利技术涉及智能控制
,尤其涉及一种语音控制方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着人工智能技术的不断发展,在人们的日常生活中,涌现出越来越多的智能设备,尤其是支持语音控制的智能家居设备,例如,智能电视、智能音箱、智能空调等。用户可以根据智能家居设备显示屏或外观上的指引文本信息,发出所述指引文本信息对应的语音,实现对相应智能设备的语音控制,用户无需手工操作遥控器,即可达到所说即所要的效果,给人们的生活带来了便利。
[0003]但是在智能设备的实际使用过程中,普遍存在用户发出的语音信息与智能设备的指引文本信息并不是完全一致的情况,导致智能设备不能准确执行相应的语音控制指令。例如,指引文本信息为“退出”,用户发出的语音信息可能是“退回去”或“结束”,或者指引文本信息为“开”,用户发出的语音信息可能是“OPEN”,针对这种情况,当前主要是通过关键字匹配或构造指引文本的相似文本集的方法,提升智能设备的对语音控制的理解力。
[0004]这 ...
【技术保护点】
【技术特征摘要】
1.一种语音控制方法,其特征在于,所述方法包括:接收语音控制信息,识别所述语音控制信息的语种类型,判断所述语种类型是否是预设的标准语种;若所述语种类型不是所述标准语种,则将所述语音控制信息转换为所述标准语种下的多个转换文本,得到所述语音控制信息对应的第一文本集;若所述语种类型是所述标准语种,则获取所述语音控制信息对应所述标准语种的多个标准文本,得到所述语音控制信息对应的第二文本集;识别智能设备的目标界面中预设声控控件对应的操作文本,计算每个所述操作文本与所述第一文本集之间的第一距离值,或计算每个所述操作文本与所述第二文本集之间的第二距离值,选择满足预设条件的第一距离值或第二距离值所对应的操作文本作为目标操作文本,根据所述目标操作文本控制所述智能设备执行相应操作。2.如权利要求1所述的语音控制方法,其特征在于,所述接收语音控制信息,识别所述语音控制信息的语种类型,包括:利用预先训练的语种识别模型的语音语种表征层,提取所述语音控制信息的语种表征向量;利用激活函数计算所述语种表征向量与预设的多个语种标签的相对概率值;根据所述相对概率值计算每一种语种标签的得分,确定得分最高的语种标签为所述语音控制信息的语种类型。3.如权利要求1所述的语音控制方法,其特征在于,所述识别智能设备的目标界面中预设声控控件对应的操作文本,包括:获取所述目标界面的界面图像;获取所述界面图像中每个所述预设声控控件的显示区域;根据所述界面图像及所述显示区域,确定每个所述声控控件的显示图像;识别每个所述显示图像声内的文本,作为对应声控控件的操作文本。4.如权利要求1所述的语音控制方法,其特征在于,所述计算每个所述操作文本与所述第一文本集之间的第一距离值,包括:对所述第一文本集中的每个文本进行词向量转换,得到所述第一文本集对应的第一词向量集,对每个所述操作文本进行词向量转换,得到每个所述操作文本的操作文本向量;利用预先训练的语义识别模型,对所述第一词向量集进行文本特征提取,得到所述第一词向量集对应的第一文本特征向量集,对每个所述操作文本的操作文本向量进行文本特征提取,得到每个所述操作文本的文本特征向量;利用预设的距离公式,计算每个所述操作文本的文本特征向量与所述第一文本特征向量集之间的第一距离值。5.如权利要求4所述的语音控制方法,其特征在于,所述利用预先训练的语义识别模型,对所述第一词向量集进行文本特征提取,得到所述第一词向量集对应的第一文本特征向量集,包括:将所述第一词向量集转化为位置向量矩阵;利用所述预先训练的语义识别模型中的多头注意力机制,将所述位置向量矩阵转化成文本特征向量关联矩阵;
利用所述预先训练...
【专利技术属性】
技术研发人员:程刚,黄石磊,陈诚,汪雪,
申请(专利权)人:深圳市北科瑞声科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。