当前位置: 首页 > 专利查询>周江锋专利>正文

一种智能家居语音控制方法、装置、设备和系统制造方法及图纸

技术编号:37196564 阅读:11 留言:0更新日期:2023-04-20 22:54
本发明专利技术属于智能家居语音控制技术领域,尤其涉及一种智能家居语音控制方法、装置、设备和系统。所述方法包括以下步骤:获取音频,并对音频进行语句分割,从而获得音频语句集;对音频语句集进行文字识别与情感分析,从而生成文字信息集与情感信息集;对音频语句集进行特定音频波进行匹配再进行分类,从而获得属性类型集;对文字信息集与属性类型集进行信息关联并进行匹配,从而获得需求文字段集;根据情感信息集、文字信息集与属性类型集进行情景还原再对需求文字段集进行情景使用筛选,从而获得需求文字集;对需求文字集进行控制命令识别,从而获得控制命令集,根据控制命令集对智能家居进行控制。实现根据用户的对话进行智能识别智能家居的控制。能家居的控制。能家居的控制。

【技术实现步骤摘要】
一种智能家居语音控制方法、装置、设备和系统


[0001]本专利技术属于智能家居语音控制
,尤其涉及一种智能家居语音控制方法、装置、设备和系统。

技术介绍

[0002]智能家居语音控制系统能实现以语音控制冰箱、电视、空调等家用电器,极大的方便了人类的生活。现有的智能家居语音控制系统中,通常是将需要控制的家用电器与中心设备(例如网关)建立连接,由语音识别设备接收用户的语音指令,并将语音指令转换成控制命令,然后通过中心设备将所述控制命令转发给目标家电,以实现对目标家电的控制。
[0003]通过命令关键词进行激活与固定命令进行工作,极大程度降低用户的使用体验。

技术实现思路

[0004]基于此,本专利技术提供一种智能家居语音控制方法、装置、设备和系统,以解决至少一个上述技术问题。
[0005]为实现上述目的,本专利技术提供一种智能家居语音控制方法,所述智能家居语音控制方法包括以下步骤:
[0006]步骤S1:获取检测范围内的音频,并对检测范围内的音频进行语句分割,从而获得音频语句集;
[0007]步骤S2:对音频语句集中的音频语句进行文字识别,获取文字内容信息集,再对音频语句集中的音频语句与文字内容信息集进行情感分析,从而生成音频情感信息集;
[0008]步骤S3:对音频语句集中的音频语句进行特定音频波进行匹配,从而获得音频属性集,对音频属性集进行分类,从而获得音频属性类型集,并根据设定的音频属性对音频属性类型集进行识别,从而确定设定属性音频信号;
[0009]步骤S4:对文字内容信息集中的文字信息与音频属性类型集中的设定属性音频信号进行信息关联,从而生成用户对话文字信息,并根据预训练的特殊文字字段对用户对话文字信息进行匹配,从而获得用户需求文字段集;
[0010]步骤S5:根据音频情感信息集、文字内容信息集与音频属性类型集进行情景还原,从而生成用户情景对话信息,根据用户情景对话信息对用户需求文字段集进行情景使用筛选,从而获得用户确定需求文字集;
[0011]步骤S6:根据设定的控制命令与需求文字库对用户确定需求文字集进行控制命令识别,从而获得准确控制命令集,根据准确控制命令集对控制命令所对应的智能家居进行控制。
[0012]本实施例通过设置收集音频的语音检测模块的收集范围,从而减小所收集的音频出现大量外部噪音的情况而增加音频降噪处理,从而减小原有音频信息通过处理出现偏差的情况发生,通过文字识别在进行情感分析,用于确定当前音频对话的讨论方向,从而判断对话中隐含的用户信息,从而确定用户的需求,通过音频属性识别从而确定音频对话的用
户音频信息,从而准确的获取用户的需求,也防止除用户外的其他人对家具进行命令从而造成用户的损失,将音频情感信息集、文字内容信息集与音频属性类型集进行情景还原从用户的角度出发进行情景呈现,使智能家居的控制中心能确切的获得用户的需求,在根据用户的需求进行控制命令的识别对智能家居进行控制,实现快速应答用户操作。
[0013]在本说明书的一个实施例中,步骤S1包括以下步骤:
[0014]步骤S11:获取检测范围内的音频;
[0015]步骤S12:根据预设的同一发生源分类模型对检测范围内的音频进行初步划分,从而获得初步发生源音频划分集;
[0016]步骤S13:对初步发生源音频划分集中的初步发生源音频进行人语识别,从而获得人语音频划分集;
[0017]步骤S14:对人语音频划分集中的人语音频进行语句分割,从而获得音频语句集。
[0018]本实施例通过同一发生源分类模型进行音频初步划分,从而将对话重叠的音频语句进行拆分,使对话内容更加清晰,为后续对音频处理的提供数据支持与便利,对初步发生源音频进行人语识别,从而去除非人类发出的音频信息,从而减小后续处理的数据量加快后续的数据处理速度,提高智能家具控制中心的反应速度和用户体验,对人语音频进行语句分割,方便后续处理数据因数据量过大导致数据处理周期太长的情况发生,还方便对音频语句集中的音频语句进行并行处理操作以加快对音频处理的速度。
[0019]在本说明书的一个实施例中,步骤S2包括以下步骤:
[0020]步骤S21:根据预设截取宽度阈值与预设移动阈值在音频语句集中的音频语句的波形图上进行移动截取,从而获得逐帧音频信号集;
[0021]步骤S22:根据预设的音频变换模型对逐帧音频信号集中的逐帧音频信号进行信号变换,从而生成逐帧频谱图,并根据时间关系对逐帧频谱图进行排序并汇总,从而获得顺序逐帧频谱图集;
[0022]步骤S23:根据预设频率颜色集对顺序逐帧频谱图集中的顺序逐帧频谱图进行颜色与频率替换,从而获得逐帧语谱图,并对逐帧语谱图进行汇总从而获得顺序逐帧语谱图集;
[0023]步骤S24:对顺序逐帧语谱图集中的逐帧语谱图进行纵向转制再进行顺序拼接,从而获得音频语谱图;
[0024]步骤S25:利用预训练的图像特征提取卷积核对音频语谱图进行卷积操作,从而生成音频语谱特征图,并根据预设的卷积分类对音频语谱特征图进行分类,从而获得音频语谱特征图相应的初始表达文字集;
[0025]步骤S26:根据顺序逐帧频谱图集所对应的时间顺序对音频语谱特征图相应的初始表达文字集进行前后语句情感呈现,从而生成音频语谱特征图对应的文字内容信息,并将文字内容信息进行汇总,从而获得文字内容信息集;
[0026]步骤S27:根据顺序逐帧频谱图集中的顺序逐帧频谱图进行情感阈值计算,从而获得情感阈值关系指数,并根据文字内容信息集中的文字内容信息与情感阈值关系指数进行匹配模拟情景再现,从而生成文字内容信息所对应的音频情感信息,将音频情感信息进行汇总,从而获得音频情感信息集;
[0027]其中情感阈值计算的感觉阈值计算公式为:
[0028][0029]其中,γ表示为情感阈值关系指数,τ表示为用户当前音频的语速的平均值,α表示为历史音频的语速的平均数值,σ表示为用户当前音频的语速的变化率,ω表示为当前音频包含的词汇数据量,ρ表示为用户当前音频的音调的平均值,表示为历史音频的音调的平均数值,d表示为函数的偏移量。
[0030]本实施例其中预设截取宽度阈值大于预设移动阈值从而实现截取区域存在重复又存在新信息,相对于预设截取宽度阈值等于预设移动阈值使截取的区域是连续的,这可能出现两个逐帧音频之间出现应截取使信息损失的情况发生,提高信息的完整性,减小对用户的音频信息进行文字识别的偏差,通过预设的音频变换模型对逐帧音频信号进行信号变换,转换信号的表达形式为后续对音频信号处理提供数据支持,通过预设频率颜色集对顺序逐帧频谱图进行颜色与频率替换,实现逐帧频谱图从二维到一维的转变从而减小音频信号的处理复杂度,从而加快对音频的处理速度,对逐帧语谱图进行纵向转制再进行顺序拼接,实现将多个逐帧音频信号转变成音频语谱图将大量数据信息转换成图像信息的处理,方便后续对图像进行处理提供数据支持,对音频语谱图进行卷积操作实现特征提取,并对音频语谱特征图进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能家居语音控制方法,其特征在于,包括以下步骤:步骤S1:获取检测范围内的音频,并对检测范围内的音频进行语句分割,从而获得音频语句集;步骤S2:对音频语句集中的音频语句进行文字识别,获取文字内容信息集,再对音频语句集中的音频语句与文字内容信息集进行情感分析,从而生成音频情感信息集;步骤S3:对音频语句集中的音频语句进行特定音频波进行匹配,从而获得音频属性集,对音频属性集进行分类,从而获得音频属性类型集,并根据设定的音频属性对音频属性类型集进行识别,从而确定设定属性音频信号;步骤S4:对文字内容信息集中的文字信息与音频属性类型集中的设定属性音频信号进行信息关联,从而生成用户对话文字信息,并根据预训练的特殊文字字段对用户对话文字信息进行匹配,从而获得用户需求文字段集;步骤S5:根据音频情感信息集、文字内容信息集与音频属性类型集进行情景还原,从而生成用户情景对话信息,根据用户情景对话信息对用户需求文字段集进行情景使用筛选,从而获得用户确定需求文字集;步骤S6:根据设定的控制命令与需求文字库对用户确定需求文字集进行控制命令识别,从而获得准确控制命令集,根据准确控制命令集对控制命令所对应的智能家居进行控制。2.根据权利要求1所述智能家居语音控制方法,其特征在于,步骤S1包括以下步骤:步骤S11:获取检测范围内的音频;步骤S12:根据预设的同一发生源分类模型对检测范围内的音频进行初步划分,从而获得初步发生源音频划分集;步骤S13:对初步发生源音频划分集中的初步发生源音频进行人语识别,从而获得人语音频划分集;步骤S14:对人语音频划分集中的人语音频进行语句分割,从而获得音频语句集。3.根据权利要求1所述智能家居语音控制方法,其特征在于,步骤S2包括以下步骤:步骤S21:根据预设截取宽度阈值与预设移动阈值在音频语句集中的音频语句的波形图上进行移动截取,从而获得逐帧音频信号集;步骤S22:根据预设的音频变换模型对逐帧音频信号集中的逐帧音频信号进行信号变换,从而生成逐帧频谱图,并根据时间关系对逐帧频谱图进行排序并汇总,从而获得顺序逐帧频谱图集;步骤S23:根据预设频率颜色集对顺序逐帧频谱图集中的顺序逐帧频谱图进行颜色与频率替换,从而获得逐帧语谱图,并对逐帧语谱图进行汇总从而获得顺序逐帧语谱图集;步骤S24:对顺序逐帧语谱图集中的逐帧语谱图进行纵向转制再进行顺序拼接,从而获得音频语谱图;步骤S25:利用预训练的图像特征提取卷积核对音频语谱图进行卷积操作,从而生成音频语谱特征图,并根据预设的卷积分类对音频语谱特征图进行分类,从而获得音频语谱特征图相应的初始表达文字集;步骤S26:根据顺序逐帧频谱图集所对应的时间顺序对音频语谱特征图相应的初始表达文字集进行前后语句情感呈现,从而生成音频语谱特征图对应的文字内容信息,并将文
字内容信息进行汇总,从而获得文字内容信息集;步骤S27:根据顺序逐帧频谱图集中的顺序逐帧频谱图进行情感阈值计算,从而获得情感阈值关系指数,并根据文字内容信息集中的文字内容信息与情感阈值关系指数进行匹配模拟情景再现,从而生成文字内容信息所对应的音频情感信息,将音频情感信息进行汇总,从而获得音频情感信息集;其中情感阈值计算的感觉阈值计算公式为:其中,γ表示为情感阈值关系指数,τ表示为用户当前音频的语速的平均值,α表示为历史音频的语速的平均数值,σ表示为用户当前音频的语速的变化率,ω表示为当前音频包含的词汇数据量,ρ表示为用户当前音频的音调的平均值,表示为历史音频的音调的平均数值,d表示为函数的偏移量。4.根据权利要求1所述智能家居语音控制方法,其特征在于,步骤S3包括以下步骤:步骤S31:对音频语句集中的音频语句进行短时傅里叶变换,从而获得加窗音频信号,再对加窗音频信号进行快速傅里叶变换,从而获得傅里叶音频模;步骤S32:对傅里叶音频模进行线性滤波处理,从而获得线性音频频谱图,并根据预估分位数噪声频率对线性音频频谱图进行噪声平滑处理,从而获得平滑音频频谱图;步骤S33:根...

【专利技术属性】
技术研发人员:周江锋褚琰
申请(专利权)人:周江锋
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1