一种电视广播媒体音视频数据的压缩方法技术

技术编号：14410020 阅读：75 留言：0更新日期：2017-01-11 20:29

本发明专利技术提供了一种电视广播媒体音视频数据的压缩方法，包括构建音视频组、建立数据头信息、使用神经网络识别空闲片段、对空闲片段进行替换、音视频数据重组以及将数据压缩为MPEG格式等步骤。本方法利用训练好的神经网络算法根据音视频片段的特征信息识别出是否为空闲片段，并将空闲片段替换为便于压缩的纯空闲音视频片段，具有压缩比率高和压缩速度快的优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种电视广播媒体音视频数据的压缩方法，属于多媒体处理领域。
技术介绍
在电视广播媒体的数据处理过程中，为方便音视频文件的传输、充分利用带宽，需要对音视频数据进行压缩。然而音视频数据中常包含一些没有实际意义的空闲片段，所述空闲片段通常是画面为与内容不相干的纯色且声音为低于30分贝的底噪的片段。空闲片段的存在影响了压缩后文件的大小。现有技术中没有提供一种方法能够对音视频中的空闲时间进行识别和充分压缩，音视频数据压缩率低。
技术实现思路
为提高含有空闲时间的音视频数据的压缩率，本专利技术提出了一种电视广播媒体音视频数据的压缩方法。本专利技术技术方案如下：一种电视广播媒体音视频数据的压缩方法，步骤如下：(1)将由音频流和视频流所组成的原始音视频数据文件以时长2s为间隔分段成音视频组，并按时间顺序为音视频组中的音视频片段标定序号；(2)建立数据头信息；(3)使用BP神经网络依次对所述音视频组中的音视频片段进行空闲识别，若识别为空闲片段则将记录该片段的序号并将序号写入数据头信息中；(4)将识别为空闲片段的音视频片段使用时长为2s、画面为纯黑色且声音为无声的音视频片段替换；(5)将经过替换后的音视频组按序号顺序重新组合为音视频数据文件，并将组合后的音视频数据文件压缩为MPEG格式；步骤(3)中所述BP神经网络对音视频片段进行空闲识别的方法步骤为：(3-1)记该音视频片段的音频流码率为x1,视频流码率为x2；将该音视频片段转换为RMVB格式，然后记RMVB格式下该片段的采样率为x3，记RMVB格式下该片段的视频流码率与压缩前的视频流码率之比为x4；计算该音视频...
一种电视广播媒体音视频数据的压缩方法

【技术保护点】
一种电视广播媒体音视频数据的压缩方法，其特征在于：步骤如下：(1)将由音频流和视频流所组成的原始音视频数据文件以时长2s为间隔分段成音视频组，并按时间顺序为音视频组中的音视频片段标定序号；(2)建立数据头信息；(3)使用BP神经网络依次对所述音视频组中的音视频片段进行空闲识别，若识别为空闲片段则将记录该片段的序号并将序号写入数据头信息中；(4)将识别为空闲片段的音视频片段使用时长为2s、画面为纯黑色且声音为无声的音视频片段替换；(5)将经过替换后的音视频组按序号顺序重新组合为音视频数据文件，并将组合后的音视频数据文件压缩为MPEG格式；步骤(3)中所述BP神经网络对音视频片段进行空闲识别的方法步骤为：(3‑1)记该音视频片段的音频流码率为x1,视频流码率为x2；将该音视频片段转换为RMVB格式，然后记RMVB格式下该片段的采样率为x3，记RMVB格式下该片段的视频流码率与压缩前的视频流码率之比为x4；计算该音视频片段压缩前的音频流平均分贝值为x5；将x1、x2、x3、x4和x5作为一组输入数据保存；(3‑2)将所述输入数据传送至BP神经网络中进行识别；该BP神经网络沿输入至输出方向依次...

【技术特征摘要】
1.一种电视广播媒体音视频数据的压缩方法，其特征在于：步骤如下：(1)将由音频流和视频流所组成的原始音视频数据文件以时长2s为间隔分段成音视频组，并按时间顺序为音视频组中的音视频片段标定序号；(2)建立数据头信息；(3)使用BP神经网络依次对所述音视频组中的音视频片段进行空闲识别，若识别为空闲片段则将记录该片段的序号并将序号写入数据头信息中；(4)将识别为空闲片段的音视频片段使用时长为2s、画面为纯黑色且声音为无声的音视频片段替换；(5)将经过替换后的音视频组按序号顺序重新组合为音视频数据文件，并将组合后的音视频数据文件压缩为MPEG格式；步骤(3)中所述BP神经网络对音视频片段进行空闲识别的方法步骤为：(3-1)记该音视频片段的音频流码率为x1,视频流码率为x2；将该音视频片段转换为RMVB格式，然后记RMVB格式下该片段的采样率为x3，记RMVB格式下该片段的视频流码率与压缩前的视频流码率之比为x4；计算该音视频片段压缩前的音频流平均分贝值为x5；将x1、x2、x3、x4和x5作为一组输入数据保存；(3-2)将所述输入数据传送至BP神经网络中进行识别；该BP神经网络沿输入至输出方向依次设置有输入层、预处理层、中间层和输出层；所述输入层包括用于输入x1的输入单元一、用于输入x2的输入单元二、用于输入x3的输入单元三、用于输入x4的输入单元四和用于输入x5的输入单元五；所述预处理层包括预处理单元一、预处理单元二、预处理单元三和预处理单元四；所述中间层包括中间单元一、中间单元二和中间单元三；所述输出层包括输出单元；所述输入层、预处理层、中间层和输出层分别为BP神经网络的第1层、第2层、第3层和第4层；所述输入单元一、输入单元二、输入单元三、输入单元四和输入单元五分别为第1层的第1单元、第2单元、第3单元、第4单元和第5单元；所述预处理单元一、预处理单元二、预处理单元三和预处理单元四分别为第2层的第1单元、第2单元、第3单元和第4单元；所述中间单元一、中间单元二和中间单元三分别为第3层的第1单元、第2...

【专利技术属性】
技术研发人员：张伟方，
申请(专利权)人：浙江华治数聚科技股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人