一种多媒体音频分析和处理方法技术

技术编号:34629765 阅读:18 留言:0更新日期:2022-08-20 09:41
本发明专利技术公开一种多媒体音频分析和处理方法,涉及音频数据处理领域,解决的技术问题问题现有技术多媒体音频分析和处理能力滞后,采用的方法是通过获取多媒体音频数据信息,通过ASR提取的模型提取多媒体音频数据信息的信息特征,将所提取到的多媒体音频数据信息的信息特征中的噪声去除,将音频中的数据信息进行分层式的特征提取,清晰解析出音频中所包含的信息内容并过滤杂波信息;通过多媒体音频特征处理函数处理多媒体音频数据信息,判断多媒体音频数据信息交互能力。本发明专利技术通过采用人工智能计算方法,能够实现音频数据信息的自动化、智能分析,提高了多媒体音频分析和处理能力。提高了多媒体音频分析和处理能力。提高了多媒体音频分析和处理能力。

【技术实现步骤摘要】
一种多媒体音频分析和处理方法


[0001]本专利技术涉及数据处理领域,且更确切地涉及一种音箱数据信息处理方法。

技术介绍

[0002]音箱指可将音频信号变换为声音的一种设备。通俗地讲,就是指音箱主机箱体或低音炮箱体内自带功率放大器,对音频信号进行放大处理后由音箱本身回放出声音,使其声音变大。音箱也是整个音响系统的终端,其作用是把音频电能转换成相应的声能,并把它辐射到空间去。它是音响系统极其重要的组成部分,担负着把电信号转变成声信号供人的耳朵直接聆听的任务。
[0003]现有技术中,多媒体数据信息很容易由多种数据信息混合而成,如何从混合的多媒体数据信息中分解音频数据信息,并从音频数据信息中分解噪音,得到清楚、纯净的数据信息仍旧是亟待解决的技术问题。在音频数据信息分析过程中,如何提取音频数据信息中的脉冲特征也是多媒体音频数据信息分析的关键要点,现有技术的媒体音频分析和处理存在自动化程度差,智能型不好的问题。

技术实现思路

[0004]针对上述技术的不足,本专利技术公开一种多媒体音频分析和处理方法,通过采用人工智能计算方法,能够实现音频数据信息的自动化、智能分析,提高了多媒体音频分析和处理能力。
[0005]为了实现上述技术效果,本专利技术采用以下技术方案:一种多媒体音频分析和处理方法,其中包括:步骤一、获取多媒体音频数据信息,音频数据信号包括源目的地址信息、麦克风数据信息、数据协议数据信息、音频脉冲振幅信息和音箱音频数据,对获取的音频数据信息进行预处理;步骤二、通过ASR提取的模型提取多媒体音频数据信息的信息特征,将所提取到的多媒体音频数据信息的信息特征中的噪声去除,将音频中的数据信息进行分层式的特征提取,清晰解析出音频中所包含的信息内容并过滤杂波信息;步骤三、通过多媒体音频特征处理函数处理多媒体音频数据信息,判断多媒体音频数据信息交互能力。
[0006]作为本专利技术进一步的技术方案,提取模型包括以下步骤:步骤一:在原始音特征中除去干扰声音内容,将频域数据信息转换到时阈数据信息处理,输出去噪后的音频数据信息,去噪函数表达式为:(1)在公式(1)中,表示原音频特征,中的s表示原音频特征标识,表示干扰声音特征,中的n表示干扰声音特征标识,表示音频差异特征,表示的
是音频特征数据变量;改进型去噪公式如公式(2)所示:(2)在公式(2)中,表示音频差异特征,其中表示减法因子,表示阈值参数,为原音频特征输出,表示干扰声音特征,表示音频特征数据变量,通过公式(2)得到纯净的音频数据信息;步骤二:引入阈值参数,将小于的音频数值统一归为阈值,对音频信号的编解码进行操作,在该模型下输入音频特征序列,以提高音频数据信息的真实性信息获取;分析函数如公式(3)所示:(3)在公式(3)中,表示输入的音频数据,中的i表示音频数据流个数,表示分析音频数据信息时音频数据信息特征值,表示阈值参数,表示的是音频数据浮动基数,表示分析输出函数,并将输入的数据信息编码处理;步骤三:对音频编码中输入的序列经过两个层次的非线性变换,得到每个时刻维数相同的状态向量组成一个集合,变换函数如公式(4)所示:(4)在公式(4)中,表示变换函数,表示输入特征序列,表示变换后的状态向量情况,表示音频数据特征变化的模式;新音频数据函数公式(5)所示:(5)在公式(5)中,表示音频数据信息采样数据经过的周期,表示音频数据状态向量组成集合,表示原音频特征下的音频数据状态向量集合,表示具有向量系数音频数据组成集合处理结果,K表示的是音频数据集合组数,表示通过更新音频数据后的音
频数据向量状态。
[0007]作为本专利技术进一步的技术方案,多媒体音频特征处理函数方法为:步骤一:多媒体音频数据信息变换;根据音频特征交互原理构建了相同标记的音频特征数据标识模型,计算变换过程中音频特征值,如公式(6)所示: (6)在公式(6)中,其中表示交互后的音频特征,表示输入的音频数据,表示交互过程中的音频变化系数,表示特征输入变量的平均值;假设交互后的音频数据信息特征状态与整个输入音频数据信息对比,最稳定状态下音频数据信息特征状态输出函数为如公式(7)所示: (7)在公式(7)中,表示音频数据信息采样数据经过的周期,表示交互过程中最稳定时音频数据信息特征状态;步骤二:接收转换后的音频数据信息,并将转换后的音频数据信息存储,当满足公式(8)时,将数据信息存储: (8)在公式(8)中,,系统接收的输入的特征数据通过转换后,等数据信息恒等于0时,表示数据转换效率最高,表明音频数据信息计量时,获取到全部转换的音频数据信息,表示音频的特征数据随时间变化的系数,表示音频特征状态数据可能产生的变化量,表示音频数据信息采样数据经过的周期;步骤三:实时调整更新的音频数据信息,并对调整后的数据信息进行预测,预测公式如公式(9)所示:
ꢀꢀ
(9)在公式(9)中,表示音频特征数据稳定函数, 表示其中某一种类型的音频特征数据表达式,其中表示在时间变化情况下的音频特征数据变化量,计算公式如公式(10)所示: (10)在公式(10)中,数据随时间变化因子的差值,表示最稳定情况下对于任意音频特征数据的接收常量;步骤四:设定接收到的音频数据信息特征,根据特征变化数据的稳定值关系式,判断音频数据存储传输: (11)
在公式(11)中,表示稳定情况下的音频特征数据输入函数,表示在时间变化情况下的音频特征数据变化量,表示已设定情况下的计划接收稳定特征数据量值;当计算出的比值系数大于1时,则代表其中夹杂有其他类型音频特征,不予以接收;当比值系数小于1时,则该类型的音频特征存储传输处理。
[0008]本专利技术有益的积极效果在于:区别于常规技术,本专利技术通过获取多媒体音频数据信息,音频数据信号包括源目的地址信息、麦克风数据信息、数据协议数据信息、音频脉冲振幅信息和音箱音频数据,对获取的音频数据信息进行预处理;通过ASR提取的模型提取多媒体音频数据信息的信息特征,将所提取到的多媒体音频数据信息的信息特征中的噪声去除,将音频中的数据信息进行分层式的特征提取,清晰解析出音频中所包含的信息内容并过滤杂波信息;通过多媒体音频特征处理函数处理多媒体音频数据信息,判断多媒体音频数据信息交互能力。
附图说明
[0009]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图,其中:图1为本专利技术流程示意图;图2为本专利技术中一种实施例示意图;图3为本专利技术中AEKF数据处理方法示意图。
具体实施方式
[0010]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0011]如图1

图3所示,一种多媒体音频分析和处理方法,包括:步骤一、获取多媒体音频数据信息,音频数据信号包括源目的地址信息、麦克风数据信息、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多媒体音频分析和处理方法,其特征在于:包括:步骤一、获取多媒体音频数据信息,音频数据信号包括源目的地址信息、麦克风数据信息、数据协议数据信息、音频脉冲振幅信息和音箱音频数据,对获取的音频数据信息进行预处理;步骤二、通过ASR提取的模型提取多媒体音频数据信息的信息特征,将所提取到的多媒体音频数据信息的信息特征中的噪声去除,将音频中的数据信息进行分层式的特征提取,清晰解析出音频中所包含的信息内容并过滤杂波信息;步骤三、通过多媒体音频特征处理函数处理多媒体音频数据信息,判断多媒体音频数据信息交互能力。2.根据权利要求1所述的一种多媒体音频分析和处理方法,其特征在于:提取模型包括以下步骤:步骤一:在原始音特征中除去干扰声音内容,将频域数据信息转换到时阈数据信息处理,输出去噪后的音频数据信息,去噪函数表达式为:(1)在公式(1)中,表示原音频特征,中的s表示原音频特征标识,表示干扰声音特征,中的n表示干扰声音特征标识,表示的是音频特征数据变量;改进型去噪公式如公式(2)所示:(2)在公式(2)中,表示音频差异特征,其中表示减法因子,表示阈值参数,为原音频特征输出,表示干扰声音特征,表示音频特征数据变量,通过公式(2)得到纯净的音频数据信息;步骤二:引入阈值参数,将小于的音频数值统一归为阈值,对音频信号的编解码进行操作,在该模型下输入音频特征序列,以提高音频数据信息的真实性信息获取;分析函数如公式(3)所示:(3)在公式(3)中,表示输入的音频数据,中的i表示音频数据流个数,表示分析音频数据信息时音频数据信息特征值,表示阈值参数,表示的是音频数据浮动基数,表示分析输出函数,并将输入的数据信息编码处理;步骤三:对音频编码中输入的序列经过两个层次的非线性变换,得到每个时刻维数相同的状态向量组成一个集合,变换函数如公式(4)所示:
(4)在公式(4)中,表示变换函数,表示输入特征序列,表示变换后的状态向量情况,表示音频数据特征变化的模式;新音频数据函数公式(5)所示:(5)在公式(5)中,表示音频数据信息采样数据经过的周期,表示音频数据状态向量组成集合,表示原音频特征下的音频数据状态向量集...

【专利技术属性】
技术研发人员:胡波
申请(专利权)人:深圳市中科睿科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1