一种音视频在线检测与虚拟声像生成方法及装置制造方法及图纸

技术编号：20246936 阅读：15 留言：0更新日期：2019-01-30 00:45

本发明专利技术提供了一种音视频在线检测与虚拟声像生成方法及装置，其中方法包括：对视频以及多声道音频进行多声道音视频在线检测，得到声音特征参数的标注文件；生成多声道音频文件，并利用多声道音频文件生成多声道音频信号，对多声道音频信号进行信号矩阵分配，得到分配结果；从声音特征参数的标注文件中提取运动声源的运动轨迹以及运动时间，并将运动声源的运动轨迹以及运动时间代入运动声源运动速率感知模型，从声音特征参数的标注文件中提取声学参数，并将声学参数代入三维声源距离感知模型，获得运动声源运动过程中所需声道以及相应声道中的声学参数；利用分配结果以及运动声源运动过程中所需声道以及相应声道中的声学参数进行虚拟声像的生成。

全部详细技术资料下载

【技术实现步骤摘要】
一种音视频在线检测与虚拟声像生成方法及装置
本专利技术涉及虚拟声像生成
，尤其涉及一种音视频在线检测与虚拟声像生成方法及装置。
技术介绍
目前市面上的影视资源更多采用多通道录制，是为了更好的达到音效的真实饱满。但是对于听众而言，确实无法完美匹配动态音效与影像画面。随着影视行业的发展，现存很多模式，其中包括杜比全景声、AURO-3D等，但也存在重放过程中声像效果不佳等问题。如何让听众在现有的环境和已有片源音频制式的情况下，对于全景声格式下虚拟声像再生成与模拟则是本处理器需要解决的问题。于此同时，对国内外全景声重放系统声像生成的技术发展与相关成果进行研究分析，不难发现其中存在以下若干问题。1)研究文献可以看出，目前全景声重放系统制式较多，但是均未明确针对上方和下方空间音效问题进行处理，且上下方空间音效重放制式也未进行规范或说明；根据现有市面上各种全景声重放方式在放映时，听者确实也感觉存在垂直空间音效声像不定，且容易混淆等问题存在；因而模拟垂直空间音效，改善上下方声像是切实需要解决的问题。2)目前的影视作品的音频制作主要分为两种：一种为同期录音即同期音，这些声音主要包括演员的对白、动作音效和拍摄现场的声音空间环境效果。另一种为后期录音。但是目前常用的是后期录音来解决动态音效以及声音空间环境效果，这样实际重放过程中就存在难以解决的声音距离感以及动态音效运动速率等问题。A、声音的距离感知的实验探究，目前的国内外的文献研究较少，也没有给出一定结论可以直接进行工程应用。a)针对不同频率成分距离感知问题，文献中标明随着频率成分和空间感知距离存在一定关系，但是没有提供...

【技术保护点】
1.一种音视频在线检测与虚拟声像生成方法，其特征在于，包括：获取影视作品，提取所述影视作品的视频以及多声道音频；对所述视频以及所述多声道音频进行多声道音视频在线检测，得到声音特征参数的标注文件；利用所述多声道音频以及所述声音特征参数的标注文件生成多声道音频文件，并利用所述多声道音频文件生成多声道音频信号，对所述多声道音频信号进行信号矩阵分配，得到分配结果；从所述声音特征参数的标注文件中提取运动声源的运动轨迹以及运动时间，并将所述运动声源的运动轨迹以及运动时间代入运动声源运动速率感知模型，从所述声音特征参数的标注文件中提取声学参数，并将所述声学参数代入三维声源距离感知模型，利用所述运动声源运动速率感知模型以及所述三维声源距离感知模型获得运动声源运动过程中所需声道以及相应声道中的声学参数；利用所述分配结果以及所述运动声源运动过程中所需声道以及相应声道中的声学参数进行虚拟声像的生成。

【技术特征摘要】
1.一种音视频在线检测与虚拟声像生成方法，其特征在于，包括：获取影视作品，提取所述影视作品的视频以及多声道音频；对所述视频以及所述多声道音频进行多声道音视频在线检测，得到声音特征参数的标注文件；利用所述多声道音频以及所述声音特征参数的标注文件生成多声道音频文件，并利用所述多声道音频文件生成多声道音频信号，对所述多声道音频信号进行信号矩阵分配，得到分配结果；从所述声音特征参数的标注文件中提取运动声源的运动轨迹以及运动时间，并将所述运动声源的运动轨迹以及运动时间代入运动声源运动速率感知模型，从所述声音特征参数的标注文件中提取声学参数，并将所述声学参数代入三维声源距离感知模型，利用所述运动声源运动速率感知模型以及所述三维声源距离感知模型获得运动声源运动过程中所需声道以及相应声道中的声学参数；利用所述分配结果以及所述运动声源运动过程中所需声道以及相应声道中的声学参数进行虚拟声像的生成。2.根据权利要求1所述的方法，其特征在于，在所述虚拟声像的生成后，还包括：利用多声道系统进行所述虚拟声像的重放。3.根据权利要求1所述的方法，其特征在于，所述将所述多声道音频信号进行信号矩阵分配，得到分配结果包括：将所述多声道音频信号进行信号矩阵分配，并在分配后，对预设部分信号采用子带随机延时去相关处理，得到分配结果。4.根据权利要求1所述的方法，其特征在于，所述声音特征参数的标注文件包括：运动声源的声音特征参数的标注文件。5.根据权利要求1或4所述的方法，其特征在于，所述声学参数包括：声压级、声源角度和频率谱。6.一种音视频在线检测与虚拟声像生成装置，其特征在于，包括：提取模块，用于获取影视作品，提取所...

【专利技术属性】
技术研发人员：牛欢，孟子厚，张茂成，申少雄，
申请(专利权)人：中国传媒大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人