【技术实现步骤摘要】
一种智能家居语音控制方法、装置、设备和系统
[0001]本专利技术属于智能家居语音控制
,尤其涉及一种智能家居语音控制方法、装置、设备和系统。
技术介绍
[0002]智能家居语音控制系统能实现以语音控制冰箱、电视、空调等家用电器,极大的方便了人类的生活。现有的智能家居语音控制系统中,通常是将需要控制的家用电器与中心设备(例如网关)建立连接,由语音识别设备接收用户的语音指令,并将语音指令转换成控制命令,然后通过中心设备将所述控制命令转发给目标家电,以实现对目标家电的控制。
[0003]通过命令关键词进行激活与固定命令进行工作,极大程度降低用户的使用体验。
技术实现思路
[0004]基于此,本专利技术提供一种智能家居语音控制方法、装置、设备和系统,以解决至少一个上述技术问题。
[0005]为实现上述目的,本专利技术提供一种智能家居语音控制方法,所述智能家居语音控制方法包括以下步骤:
[0006]步骤S1:获取检测范围内的音频,并对检测范围内的音频进行语句分割,从而获得音频语句集;
[0007]步骤S2:对音频语句集中的音频语句进行文字识别,获取文字内容信息集,再对音频语句集中的音频语句与文字内容信息集进行情感分析,从而生成音频情感信息集;
[0008]步骤S3:对音频语句集中的音频语句进行特定音频波进行匹配,从而获得音频属性集,对音频属性集进行分类,从而获得音频属性类型集,并根据设定的音频属性对音频属性类型集进行识别,从而确定设定属性音频信号;
[00 ...
【技术保护点】
【技术特征摘要】
1.一种智能家居语音控制方法,其特征在于,包括以下步骤:步骤S1:获取检测范围内的音频,并对检测范围内的音频进行语句分割,从而获得音频语句集;步骤S2:对音频语句集中的音频语句进行文字识别,获取文字内容信息集,再对音频语句集中的音频语句与文字内容信息集进行情感分析,从而生成音频情感信息集;步骤S3:对音频语句集中的音频语句进行特定音频波进行匹配,从而获得音频属性集,对音频属性集进行分类,从而获得音频属性类型集,并根据设定的音频属性对音频属性类型集进行识别,从而确定设定属性音频信号;步骤S4:对文字内容信息集中的文字信息与音频属性类型集中的设定属性音频信号进行信息关联,从而生成用户对话文字信息,并根据预训练的特殊文字字段对用户对话文字信息进行匹配,从而获得用户需求文字段集;步骤S5:根据音频情感信息集、文字内容信息集与音频属性类型集进行情景还原,从而生成用户情景对话信息,根据用户情景对话信息对用户需求文字段集进行情景使用筛选,从而获得用户确定需求文字集;步骤S6:根据设定的控制命令与需求文字库对用户确定需求文字集进行控制命令识别,从而获得准确控制命令集,根据准确控制命令集对控制命令所对应的智能家居进行控制。2.根据权利要求1所述智能家居语音控制方法,其特征在于,步骤S1包括以下步骤:步骤S11:获取检测范围内的音频;步骤S12:根据预设的同一发生源分类模型对检测范围内的音频进行初步划分,从而获得初步发生源音频划分集;步骤S13:对初步发生源音频划分集中的初步发生源音频进行人语识别,从而获得人语音频划分集;步骤S14:对人语音频划分集中的人语音频进行语句分割,从而获得音频语句集。3.根据权利要求1所述智能家居语音控制方法,其特征在于,步骤S2包括以下步骤:步骤S21:根据预设截取宽度阈值与预设移动阈值在音频语句集中的音频语句的波形图上进行移动截取,从而获得逐帧音频信号集;步骤S22:根据预设的音频变换模型对逐帧音频信号集中的逐帧音频信号进行信号变换,从而生成逐帧频谱图,并根据时间关系对逐帧频谱图进行排序并汇总,从而获得顺序逐帧频谱图集;步骤S23:根据预设频率颜色集对顺序逐帧频谱图集中的顺序逐帧频谱图进行颜色与频率替换,从而获得逐帧语谱图,并对逐帧语谱图进行汇总从而获得顺序逐帧语谱图集;步骤S24:对顺序逐帧语谱图集中的逐帧语谱图进行纵向转制再进行顺序拼接,从而获得音频语谱图;步骤S25:利用预训练的图像特征提取卷积核对音频语谱图进行卷积操作,从而生成音频语谱特征图,并根据预设的卷积分类对音频语谱特征图进行分类,从而获得音频语谱特征图相应的初始表达文字集;步骤S26:根据顺序逐帧频谱图集所对应的时间顺序对音频语谱特征图相应的初始表达文字集进行前后语句情感呈现,从而生成音频语谱特征图对应的文字内容信息,并将文
字内容信息进行汇总,从而获得文字内容信息集;步骤S27:根据顺序逐帧频谱图集中的顺序逐帧频谱图进行情感阈值计算,从而获得情感阈值关系指数,并根据文字内容信息集中的文字内容信息与情感阈值关系指数进行匹配模拟情景再现,从而生成文字内容信息所对应的音频情感信息,将音频情感信息进行汇总,从而获得音频情感信息集;其中情感阈值计算的感觉阈值计算公式为:其中,γ表示为情感阈值关系指数,τ表示为用户当前音频的语速的平均值,α表示为历史音频的语速的平均数值,σ表示为用户当前音频的语速的变化率,ω表示为当前音频包含的词汇数据量,ρ表示为用户当前音频的音调的平均值,表示为历史音频的音调的平均数值,d表示为函数的偏移量。4.根据权利要求1所述智能家居语音控制方法,其特征在于,步骤S3包括以下步骤:步骤S31:对音频语句集中的音频语句进行短时傅里叶变换,从而获得加窗音频信号,再对加窗音频信号进行快速傅里叶变换,从而获得傅里叶音频模;步骤S32:对傅里叶音频模进行线性滤波处理,从而获得线性音频频谱图,并根据预估分位数噪声频率对线性音频频谱图进行噪声平滑处理,从而获得平滑音频频谱图;步骤S33:根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。