【技术实现步骤摘要】
一种基于神经算法多源音频特征的智能仿真方法和系统
[0001]本专利技术涉及用户识别技术及多媒体
,具体为一种基于神经算法多源音频特征的智能仿真方法和系统。
技术介绍
[0002]21世纪是网络高速发展的时代,随着互联网的普及,利用网络传输音频信号的需求也越来越大。流媒体技术的出现,在一定程度上使互联网传输音频难的局面得到改善,其将过去传统媒体的“推”式传播,变为受众的“拉”式传播与实时传播。由于流媒体技术在一定程度上突破了网络带宽对多媒体信息传输的限制,因此被广泛运用于网上直播、网络会议、远程教育及企业培训等多种领域。为了更好的进行流媒体的传输,通常需要对于流媒体质量进行评测,同时也对流媒体音频的质量评测提出了新的挑战。
[0003]现有的仿真方法由于必须在特定的时间和地点集中进行测试,对受测者的时间安排和所在地理位置上都做出了一定限制,选择的受测者不能够覆盖应有的构成成分。同时由于整个实验持续时间不可过长,受测总人数有较大限制,使得主观仿真不能够得到足够的可用数据。目前对受测者的资格认证需要人工进行,可能出现偏差导致无资格受测者参加测试产生不可用数据。实验过程需要大量工作人员进行全程监督和操作,耗费大量人力物力。原始测试数据需要人工录入电脑,存在录入错误的可能性。
[0004]而且现有的如NIST Net、NS2等网络仿真软件仅专注于网络本身特性的研究,此类软件中无语音传输和编码的设置,因此仅仅依靠这些仿真软件还无法满足对音频进行研究的需求。而依托真实网络进行音频帧参数对音频影响的实验中,音 ...
【技术保护点】
【技术特征摘要】
1.一种基于神经算法多源音频特征的智能仿真方法,其特征在于,包括步骤:音频源乐器数据采集,在音频源乐器运行过程中,采用MPEG音频采集设备仿真到音频采集设备当前位置下的音频源数据的用户元数据信息和MPEG信源编码音频帧,基于高斯神经网络方法提取出当前帧的识别用户,采集所述音频源数据的质量等级音频帧;用户识别,分别计算所述质量等级音频帧的预先选定的音高中心和中断片段内的实时平均用户元数据信息,将所述实时平均用户元数据信息作为后续步骤中确定仿真模型召回度信息的依据;模拟操作,将计算出的所述实时平均用户元数据信息与所述音频源乐器的固有参数相结合,确定所述仿真模型的实时召回度,依据模拟逻辑,结合所述仿真模型的实时召回度的自适应调整策略,匹配所述仿真模型与所述音频源数据的相应位置;音频源乐器仿真,根据所述仿真模型的召回度确定结果,所述音频源乐器的周期管理器通过定时信号反馈音频源乐器,并将仿真完成的音频源乐器通过可信数据库存储在音频接收器端的音频源乐器白名单库中。2.如权利要求1所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述音频源乐器数据采集,在音频源乐器运行过程中,采用MPEG音频采集设备仿真到音频采集设备当前位置下的音频源数据的用户元数据信息和MPEG信源编码音频帧,基于高斯神经网络方法提取出当前帧的识别用户,采集所述音频源数据的质量等级音频帧,具体包括:基于倒谱系数和塔型算法的样本声音检测法从音频源数据音频帧中采集样本声音的音频帧坐标;其中,通过安装所述仿真模型上的音高音频采集设备能实时采集音频源数据中不同等级的音频源乐器和背景的质量等级音频帧;当音高音频采集设备垂直收音音频源乐器预设范围内时,音频源乐器多角度布置,过滤音频源乐器间的空白区域返回的异常音高值和音量峰谷差异值大的样本声音返回的过小音高值,得到音频源数据上样本声音的平均用户元数据信息;使用倒谱系数和塔型算法的样本声音检测算法实现待仿真声音和背景中的样本声音去噪分离,优化获得的所述样本声音的平均用户元数据信息。3.如权利要求2所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述用户识别,分别计算所述质量等级音频帧的预先选定的音高中心和中断片段内的实时平均用户元数据信息,将所述实时平均用户元数据信息作为后续步骤中确定仿真模型召回度信息的依据,具体包括:基于用户元数据信息的高斯神经网络方法根据各区域聚类的音高权重提取出样本声音区域;其中,基于频谱聚类算法将输入的质量等级音频帧划分为K个区域聚类;计算音高音频帧中区域聚类k的初始显著性值;将单声道先验调整为新的用户元数据信息权重,修正初始显著值和双声道映射,得到修正后得到的修正显著值;在得到所述修正显著值后,将输出的显著用户区域的平均音高与在MPEG空间内去噪分离并采集的样本声音以及对应的位置坐标结合,得到样本声音的位置
‑
音高集成信息;在后续的反馈召回度计算步骤中,所述位置
‑
音高集成信息将作为初始输入信息,执行
所述仿真模型对音频源数据的特征自适应模拟。4.如权利要求3所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述模拟操作,将计算出的所述实时平均用户元数据信息与所述音频源乐器的固有参数相结合,确定所述仿真模型的实时召回度,依据模拟逻辑,结合所述仿真模型的实时召回度的自适应调整策略,匹配所述仿真模型与所述音频源数据的相应位置,具体包括:固定音高音频采集设备位置:固定音高音频采集设备与用户音频输出之间的相对位置,并且采集音高音频采集设备与所述仿真模型之间的相对位置数据,采集音频源乐器采取性能值:利用音高音频采集设备采集所述仿真模型处音频源数据的视频帧,所述视频帧的数据为包括有用户元数据信息的三维空间数据,并通过所述视频帧的数据计算得出所述仿真模型的仿真结果分数至音频源数据评价分数之间的差值,所述仿真模型的仿真结果分数至音频源数据评价分数之间的差值为音频源乐器采取性能值,调整所述仿真模型的召回度状态:将所述音频源乐器采取性能值与预期音频源乐器性能值相比较,对所述仿真模型的位置召回度状态进行调整,使所述音频源乐器采取性能值满足音频源乐器预期性能值的要求,所述仿真模型的位置召回度状态调整包括对所述仿真模型进行上升和下降的调整。5.如权利要求4所述的一种基于神经算法多源音频特征的智能仿真方法,其特征在于,所述音频源乐器仿真,根据所述仿真模型的召回度确定结果,所述音频源乐器的周期管理器通过定时信号反馈音频源乐器,并将仿真完成的音频源乐器通过可信数据库存储在音频接收器端的音频源乐器白名单库中,具体包括:所述音频源乐器白名单库至少包括第一白名单库、第二白名单库、第三白名单库;所述等级至少包括低质量等级、合格质量等级、高质量等级;所述第一白名单库用于收集低质量等级的音频源乐器,所述第二白名单库用于收集低质量等级的音频源乐器,所述第三白名单库用于收集低质量等级的音频源乐器;所述音频源乐器在所述仿真模型未进行反馈作业时均呈关闭状态;根据所述仿真模型的召回度确定结果,当所述仿真模型仿真低质量等级的音频源乐器且所述仿真模型的召回度确定结果调整为用户音高下降时,关闭所述第一白名单库并开启所述第二白名单库;当所述仿真模型仿真合格质量等级的音频源乐器且所述仿真模型的召回度确定结果调整为用户音高下降时,关闭所述第二白名单库并开启所述第三白名单库;当所述仿真模型仿真低质量等级的音频源乐器且所述仿真模型的召回度确定结果调整为用户音高上升时,关闭所述第一白名单库;当所述仿真模型仿真合格质量等级的音频源乐器且...
【专利技术属性】
技术研发人员:边仿,宋绯飞,王友建,
申请(专利权)人:昆山海菲曼科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。