一种基于神经算法多源音频特征的智能仿真方法和系统技术方案

技术编号:38752740 阅读:9 留言:0更新日期:2023-09-09 11:19
本发明专利技术请求保护一种基于神经算法多源音频特征的智能仿真方法和系统,通过采集仿真音频源数据,基于高斯神经网络方法提取出当前帧的识别用户,采集质量等级音频帧并计算预先选定的音高中心和中断片段内的实时平均用户元数据信息作为确定仿真模型召回度信息的依据,之后确定仿真模型的实时召回度结合仿真模型的实时召回度的自适应调整策略,匹配仿真模型与音频源数据的相应位置;最终音频源乐器的周期管理器通过定时信号反馈音频源乐器并存储在音频接收器端的音频源乐器白名单库中。该方案通过准确的音频帧识别和质量性能值粗细结合识别出不同等级的音频源乐器内容,达到自适应音频源乐器等级准确收集音频源乐器的效果。应音频源乐器等级准确收集音频源乐器的效果。应音频源乐器等级准确收集音频源乐器的效果。

【技术实现步骤摘要】
一种基于神经算法多源音频特征的智能仿真方法和系统


[0001]本专利技术涉及用户识别技术及多媒体
,具体为一种基于神经算法多源音频特征的智能仿真方法和系统。

技术介绍

[0002]21世纪是网络高速发展的时代,随着互联网的普及,利用网络传输音频信号的需求也越来越大。流媒体技术的出现,在一定程度上使互联网传输音频难的局面得到改善,其将过去传统媒体的“推”式传播,变为受众的“拉”式传播与实时传播。由于流媒体技术在一定程度上突破了网络带宽对多媒体信息传输的限制,因此被广泛运用于网上直播、网络会议、远程教育及企业培训等多种领域。为了更好的进行流媒体的传输,通常需要对于流媒体质量进行评测,同时也对流媒体音频的质量评测提出了新的挑战。
[0003]现有的仿真方法由于必须在特定的时间和地点集中进行测试,对受测者的时间安排和所在地理位置上都做出了一定限制,选择的受测者不能够覆盖应有的构成成分。同时由于整个实验持续时间不可过长,受测总人数有较大限制,使得主观仿真不能够得到足够的可用数据。目前对受测者的资格认证需要人工进行,可能出现偏差导致无资格受测者参加测试产生不可用数据。实验过程需要大量工作人员进行全程监督和操作,耗费大量人力物力。原始测试数据需要人工录入电脑,存在录入错误的可能性。
[0004]而且现有的如NIST Net、NS2等网络仿真软件仅专注于网络本身特性的研究,此类软件中无语音传输和编码的设置,因此仅仅依靠这些仿真软件还无法满足对音频进行研究的需求。而依托真实网络进行音频帧参数对音频影响的实验中,音频帧参数难以进行精确的设制,不具备可重复性,且需要很多路由器、交换机等价格昂贵的设备以及相关软硬件支持。传统的实验环境均没有考虑对终端设备的波形、音量、录音方式进行精确控制,也未考虑时延对交互音频体验质量的影响,使实验平台缺乏稳定性以及实用性。

技术实现思路

[0005]本专利技术提供了一种基于神经算法多源音频特征的智能仿真方法和系统,解决了现有音频源乐器检测识别方法错误检测非用户仿真行音频源乐器的问题,进而有效解决音频源乐器仿真机器人错误执行仿真非用户行音频源乐器,导致无法完成仿真故障问题,以及末端周期管理器与用户仿真行音频源乐器发生失真问题。
[0006]根据本专利技术第一方面,本专利技术请求保护一种基于神经算法多源音频特征的智能仿真方法,其特征在于,包括步骤:
[0007]音频源乐器数据采集,在音频源乐器运行过程中,采用MPEG音频采集设备仿真到音频采集设备当前位置下的音频源数据的用户元数据信息和MPEG信源编码音频帧,基于高斯神经网络方法提取出当前帧的识别用户,采集音频源数据的质量等级音频帧;
[0008]用户识别,分别计算质量等级音频帧的预先选定的音高中心和中断片段内的实时平均用户元数据信息,将实时平均用户元数据信息作为后续步骤中确定仿真模型召回度信
息的依据;
[0009]模拟操作,将计算出的实时平均用户元数据信息与音频源乐器的固有参数相结合,确定仿真模型的实时召回度,依据模拟逻辑,结合仿真模型的实时召回度的自适应调整策略,匹配仿真模型与音频源数据的相应位置;
[0010]音频源乐器仿真,根据仿真模型的召回度确定结果,音频源乐器的周期管理器通过定时信号反馈音频源乐器,并将仿真完成的音频源乐器通过可信数据库存储在音频接收器端的音频源乐器白名单库中。
[0011]具体的,音频源乐器数据采集,在音频源乐器运行过程中,采用MPEG音频采集设备仿真到音频采集设备当前位置下的音频源数据的用户元数据信息和MPEG信源编码音频帧,基于高斯神经网络方法提取出当前帧的识别用户,采集音频源数据的质量等级音频帧,具体包括:
[0012]基于倒谱系数和塔型算法的样本声音检测法从音频源数据音频帧中采集样本声音的音频帧坐标;
[0013]其中,通过安装仿真模型上的音高音频采集设备能实时采集音频源数据中不同等级的音频源乐器和背景的质量等级音频帧;
[0014]当音高音频采集设备垂直收音音频源乐器预设范围内时,音频源乐器多角度布置,过滤音频源乐器间的空白区域返回的异常音高值和音量峰谷差异值大的样本声音返回的过小音高值,得到音频源数据上样本声音的平均用户元数据信息;
[0015]使用倒谱系数和塔型算法的样本声音检测算法实现待仿真声音和背景中的样本声音去噪分离,优化获得的样本声音的平均用户元数据信息。
[0016]具体的,用户识别,分别计算质量等级音频帧的预先选定的音高中心和中断片段内的实时平均用户元数据信息,将实时平均用户元数据信息作为后续步骤中确定仿真模型召回度信息的依据,具体包括:
[0017]基于用户元数据信息的高斯神经网络方法根据各区域聚类的音高权重提取出样本声音区域;
[0018]其中,基于频谱聚类算法将输入的质量等级音频帧划分为K个区域聚类;
[0019]计算音高音频帧中区域聚类k的初始显著性值;
[0020]将单声道先验调整为新的用户元数据信息权重,修正初始显著值和双声道映射,得到修正后得到的修正显著值;
[0021]在得到修正显著值后,将输出的显著用户区域的平均音高与在MPEG空间内去噪分离并采集的样本声音以及对应的位置坐标结合,得到样本声音的位置

音高集成信息;
[0022]在后续的反馈召回度计算步骤中,位置

音高集成信息将作为初始输入信息,执行仿真模型对音频源数据的特征自适应模拟。
[0023]具体的,模拟操作,将计算出的实时平均用户元数据信息与音频源乐器的固有参数相结合,确定仿真模型的实时召回度,依据模拟逻辑,结合仿真模型的实时召回度的自适应调整策略,匹配仿真模型与音频源数据的相应位置,具体包括:
[0024]固定音高音频采集设备位置:固定音高音频采集设备与用户音频输出之间的相对位置,并且采集音高音频采集设备与仿真模型之间的相对位置数据,
[0025]采集音频源乐器采取性能值:利用音高音频采集设备采集仿真模型处音频源数据
的视频帧,视频帧的数据为包括有用户元数据信息的三维空间数据,并通过视频帧的数据计算得出仿真模型的仿真结果分数至音频源数据评价分数之间的差值,仿真模型的仿真结果分数至音频源数据评价分数之间的差值为音频源乐器采取性能值;
[0026]调整仿真模型的召回度状态:将音频源乐器采取性能值与预期音频源乐器性能值相比较,对仿真模型的位置召回度状态进行调整,使音频源乐器采取性能值满足音频源乐器预期性能值的要求,仿真模型的位置召回度状态调整包括对仿真模型进行上升和下降的调整。
[0027]具体的,音频源乐器仿真,根据仿真模型的召回度确定结果,音频源乐器的周期管理器通过定时信号反馈音频源乐器,并将仿真完成的音频源乐器通过可信数据库存储在音频接收器端的音频源乐器白名单库中,具体包括:
[0028]音频源乐器白名单库至少包括第一白名单库、第二白名单库、第三白名单库;
[0029]等级至少包括低质量等级本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于神经算法多源音频特征的智能仿真方法,其特征在于,包括步骤:音频源乐器数据采集,在音频源乐器运行过程中,采用MPEG音频采集设备仿真到音频采集设备当前位置下的音频源数据的用户元数据信息和MPEG信源编码音频帧,基于高斯神经网络方法提取出当前帧的识别用户,采集所述音频源数据的质量等级音频帧;用户识别,分别计算所述质量等级音频帧的预先选定的音高中心和中断片段内的实时平均用户元数据信息,将所述实时平均用户元数据信息作为后续步骤中确定仿真模型召回度信息的依据;模拟操作,将计算出的所述实时平均用户元数据信息与所述音频源乐器的固有参数相结合,确定所述仿真模型的实时召回度,依据模拟逻辑,结合所述仿真模型的实时召回度的自适应调整策略,匹配所述仿真模型与所述音频源数据的相应位置;音频源乐器仿真,根据所述仿真模型的召回度确定结果,所述音频源乐器的周期管理器通过定时信号反馈音频源乐器,并将仿真完成的音频源乐器通过可信数据库存储在音频接收器端的音频源乐器白名单库中。2.如权利要求1所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述音频源乐器数据采集,在音频源乐器运行过程中,采用MPEG音频采集设备仿真到音频采集设备当前位置下的音频源数据的用户元数据信息和MPEG信源编码音频帧,基于高斯神经网络方法提取出当前帧的识别用户,采集所述音频源数据的质量等级音频帧,具体包括:基于倒谱系数和塔型算法的样本声音检测法从音频源数据音频帧中采集样本声音的音频帧坐标;其中,通过安装所述仿真模型上的音高音频采集设备能实时采集音频源数据中不同等级的音频源乐器和背景的质量等级音频帧;当音高音频采集设备垂直收音音频源乐器预设范围内时,音频源乐器多角度布置,过滤音频源乐器间的空白区域返回的异常音高值和音量峰谷差异值大的样本声音返回的过小音高值,得到音频源数据上样本声音的平均用户元数据信息;使用倒谱系数和塔型算法的样本声音检测算法实现待仿真声音和背景中的样本声音去噪分离,优化获得的所述样本声音的平均用户元数据信息。3.如权利要求2所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述用户识别,分别计算所述质量等级音频帧的预先选定的音高中心和中断片段内的实时平均用户元数据信息,将所述实时平均用户元数据信息作为后续步骤中确定仿真模型召回度信息的依据,具体包括:基于用户元数据信息的高斯神经网络方法根据各区域聚类的音高权重提取出样本声音区域;其中,基于频谱聚类算法将输入的质量等级音频帧划分为K个区域聚类;计算音高音频帧中区域聚类k的初始显著性值;将单声道先验调整为新的用户元数据信息权重,修正初始显著值和双声道映射,得到修正后得到的修正显著值;在得到所述修正显著值后,将输出的显著用户区域的平均音高与在MPEG空间内去噪分离并采集的样本声音以及对应的位置坐标结合,得到样本声音的位置

音高集成信息;在后续的反馈召回度计算步骤中,所述位置

音高集成信息将作为初始输入信息,执行
所述仿真模型对音频源数据的特征自适应模拟。4.如权利要求3所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述模拟操作,将计算出的所述实时平均用户元数据信息与所述音频源乐器的固有参数相结合,确定所述仿真模型的实时召回度,依据模拟逻辑,结合所述仿真模型的实时召回度的自适应调整策略,匹配所述仿真模型与所述音频源数据的相应位置,具体包括:固定音高音频采集设备位置:固定音高音频采集设备与用户音频输出之间的相对位置,并且采集音高音频采集设备与所述仿真模型之间的相对位置数据,采集音频源乐器采取性能值:利用音高音频采集设备采集所述仿真模型处音频源数据的视频帧,所述视频帧的数据为包括有用户元数据信息的三维空间数据,并通过所述视频帧的数据计算得出所述仿真模型的仿真结果分数至音频源数据评价分数之间的差值,所述仿真模型的仿真结果分数至音频源数据评价分数之间的差值为音频源乐器采取性能值,调整所述仿真模型的召回度状态:将所述音频源乐器采取性能值与预期音频源乐器性能值相比较,对所述仿真模型的位置召回度状态进行调整,使所述音频源乐器采取性能值满足音频源乐器预期性能值的要求,所述仿真模型的位置召回度状态调整包括对所述仿真模型进行上升和下降的调整。5.如权利要求4所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述音频源乐器仿真,根据所述仿真模型的召回度确定结果,所述音频源乐器的周期管理器通过定时信号反馈音频源乐器,并将仿真完成的音频源乐器通过可信数据库存储在音频接收器端的音频源乐器白名单库中,具体包括:所述音频源乐器白名单库至少包括第一白名单库、第二白名单库、第三白名单库;所述等级至少包括低质量等级、合格质量等级、高质量等级;所述第一白名单库用于收集低质量等级的音频源乐器,所述第二白名单库用于收集低质量等级的音频源乐器,所述第三白名单库用于收集低质量等级的音频源乐器;所述音频源乐器在所述仿真模型未进行反馈作业时均呈关闭状态;根据所述仿真模型的召回度确定结果,当所述仿真模型仿真低质量等级的音频源乐器且所述仿真模型的召回度确定结果调整为用户音高下降时,关闭所述第一白名单库并开启所述第二白名单库;当所述仿真模型仿真合格质量等级的音频源乐器且所述仿真模型的召回度确定结果调整为用户音高下降时,关闭所述第二白名单库并开启所述第三白名单库;当所述仿真模型仿真低质量等级的音频源乐器且所述仿真模型的召回度确定结果调整为用户音高上升时,关闭所述第一白名单库;当所述仿真模型仿真合格质量等级的音频源乐器且...

【专利技术属性】
技术研发人员:边仿宋绯飞王友建
申请(专利权)人:昆山海菲曼科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1