【技术实现步骤摘要】
基于环境感知的音频装置智能控制方法及系统
[0001]本专利技术涉及音频控制
,尤其涉及一种基于环境感知的音频装置智能控制方法及系统
。
技术介绍
[0002]声音是人类社会生活中数据的重要组成部分,因此,通过对声音进行有效地分析我们能够从中挖掘出大量的有用信息
。
通过音频的特征处理,能够识别环境中的特殊场景,现有技术中,对于通过音频来识别处于何种场景的精度低下,使得电子设备基于原有的音频调控参数输出音频可能并不适合用户收听音频,降低用户的使用体验
。
技术实现思路
[0003]本专利技术克服了现有技术的不足,提供了一种基于环境感知的音频装置智能控制方法及系统
。
[0004]为达上述目的,本专利技术采用的技术方案为:本专利技术第一方面提供了一种基于环境感知的音频装置智能控制方法,包括以下步骤:获取各场景中的历史音频特征数据,并融合图神经网络,通过所述图神经网络对所述各场景中的历史音频特征数据进行处理,获取相关的邻接矩阵;融合余弦相似度量法,通过所述余弦 ...
【技术保护点】
【技术特征摘要】
1.
基于环境感知的音频装置智能控制方法,其特征在于,包括以下步骤:获取各场景中的历史音频特征数据,并融合图神经网络,通过所述图神经网络对所述各场景中的历史音频特征数据进行处理,获取相关的邻接矩阵;融合余弦相似度量法,通过所述余弦相似度量法对所述相关的邻接矩阵中的节点进行更新,获取更新后各场景的邻接矩阵;根据所述更新后各场景的邻接矩阵构建场景识别模型,通过所述场景识别模型对当前环境中的音频特征数据进行识别,获取相关的音频场景;根据所述相关的音频场景生成音频装置的控制参数,并通过所述音频装置的控制参数对音频装置进行控制
。2.
根据权利要求1所述的基于环境感知的音频装置智能控制方法,其特征在于,获取各场景中的历史音频特征数据,具体包括:获取各场景中的历史音频数据信息,通过自适应噪声抵消法对所述历史音频数据信息进行降噪处理,使得信号源和噪声源相互独立,获取降噪处理后的历史音频数据信息;通过对所述降噪处理后的历史音频数据进行分帧加窗处理,每次加窗后得到一个数据帧,通过将所述数据帧进行帧移处理,计算帧移后的数据帧特征;通过对所述数据帧特征进行傅里叶变换,将所述数据帧特征进行分解,获取声音在频域上的特征,并根据所述声音在频域上的特征生成各场景中的历史音频特征数据
。3.
根据权利要求1所述的基于环境感知的音频装置智能控制方法,其特征在于,融合图神经网络,通过所述图神经网络对所述各场景中的历史音频特征数据进行处理,获取相关的邻接矩阵,具体包括:融合图神经网络,将所述各场景中的历史音频特征数据作为第一图节点,并获取第一图节点之间的关联性,根据所述第一图节点之间的关联性构建第一有向边描述;通过所述第一有向边描述的指向性将具有关联性的第一图节点进行连接,同时,将每一历史音频特征数据所对应的场景类型作为第二图节点;根据每一历史音频特征数据与对应的场景类型之间的关系构建第二有向边描述,使得所述第一图节点指向第二图节点,并获取与第一有向边描述相关的第一图节点;从与第一有向边描述相关的两个或者多个第一图节点中随机选取一个第一图节点作为可连接的图节点,将所述可连接的图节点与其余第一图节点通过第二有向边描述,构建拓扑结构图,并获取相关的邻接矩阵
。4.
根据权利要求1所述的基于环境感知的音频装置智能控制方法,其特征在于,融合余弦相似度量法,通过所述余弦相似度量法对所述相关的邻接矩阵中的节点进行更新,获取更新后各场景的邻接矩阵,具体包括:引入
PCA
算法,通过所述
PCA
算法对所述相关的邻接矩阵进行降维处理,获取特征矩阵,获取所述特征矩阵中的特征向量,并融合余弦相似度量法;预设余弦阈值信息,通过所述余弦相似度量算法计算特征向量之间的余弦值,并判断所述余弦值是否不大于所述余弦阈值信息;若所述余弦值不大于所述余弦阈值信息,则获取余弦值不大于所述余弦阈值信息所对应的第一图节点作为冗余节点,并将所述冗余节点进行剔除;若余弦值大于所述余弦阈值信息,则将余弦值大于所述余弦阈值信息所对应的第一图
节点作为信任节点,根据所述冗余节点以及信息节点进行第一图节点更新,获取更新后各场景的邻接矩阵
。5.
根据权利要求1所述的基于环境感知的音频装置智能控制方法,其特征在于,根据所述更新后各场景的邻接矩阵构建场景识别模型,通过所述场景识别模型对当前环境中的音频特征数据进行识别,获取相关的音频场景,具体包括:基于递归神经网络构建场景识别模型,引入循环空间注意力机制,将所述更新后的各场景的邻接矩阵输入到所述循环空间注意力机制中进行处理,获取特征图;通过对所述特征图中的每个音频特征数据进行
SoftMax
操作,生成具有空间注意的归一化特征图,并对所述具有空间注意的归一化特征图以及所述更新后各场景的邻接矩阵进行内积运算,使得注意力集中在音频特征数据中,生成注意力特征图;将所述注意力特征图输入到所述场景识别模型中,将所述注意力特征图与隐含层中的隐含状态协同工作,更新隐含层状态,输出场景识别模型;获取当前环境中的音频特征数据信息,并通过所述场景识别模型对所述当前环境...
【专利技术属性】
技术研发人员:黄洪平,邓胜丰,白启昊,
申请(专利权)人:深圳市齐奥通信技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。