当前位置: 首页 > 专利查询>朱贤桢专利>正文

基于AI算法的视频压缩和解压方法技术

技术编号:35052193 阅读:58 留言:0更新日期:2022-09-28 10:55
本发明专利技术涉及数据处理方法领域,具体为一种基于AI算法的视频压缩和解压方法。一种基于AI算法的视频压缩和解压方法,包括一、压缩和二、解压缩,其特征是:一、压缩时,按如下步骤依次实施:步骤1,分析;步骤2,获取;步骤3,提取;步骤4,压缩;二、解压缩时,包括3个步骤。本发明专利技术大大节省视频文件的存储空间。大节省视频文件的存储空间。大节省视频文件的存储空间。

【技术实现步骤摘要】
基于AI算法的视频压缩和解压方法


[0001]本专利技术涉及数据处理方法领域,具体为一种基于AI算法的视频压缩和解压方法。

技术介绍

[0002]现有的视频都是按照传统的编码方式压缩储存的,图像压缩的效率不高,占用的存储空间大。在数据量几何增长的今天,如何更好更省地存储视频就成为了一个对优化社会资源很重要的问题。在一些视频复杂度不是非常高的情况下,例如各种场景中的监控录像,背景内容变化不大,采用常规方法压缩视频内容会降低存储空间的利用率,影响存储容量。

技术实现思路

[0003]为了克服现有技术的缺陷,提供一种提升视频压缩效率、节省存储空间的数据处理,本专利技术公开了一种基于AI算法的视频压缩和解压方法。
[0004]本专利技术通过如下技术方案达到专利技术目的:一种基于AI算法的视频压缩和解压方法,包括一、压缩和二、解压缩,其特征是:一、压缩时,按如下步骤依次实施:步骤1,分析:通过视频codec分析视频文件,获取所述视频文件中的视频信息,并判断所述视频文件是否包含音频信息,如果所述视频文件包含音频信息,则利用所述视频文件的格式所对应的编译器算法,分离出音频信息;视频文件格式有多种,这面采用mpg格式为例,如何分离视频信息和音频信息:如果mpg文件以0x000001B3作为起始码,则所述mpg文件只包括视频信息,如果以0x000001BA为开头,则所述mpg文件包括视频信息和音频信息;一个mpg文件内有多个pack,每个pack即为一个已被分割开的mpg文件,如果遇到0x000001BA或者0x000001B3,则表示一个pack结束,一个pack内会包含pack_header,system_hader以及PES_packets,PES_packets是包含图像信息和音频信息的数据包;如果PES_packets开头为0x000001E0~0x000001EF,则表示是所述mpg文件中视频信息的PES起始代码,如果为0x000001C0~0x000001DF,则表示是所述mpg文件中音频信息的PES起始代码,每一个PES_packet遇到下一个0x000001E0~0x000001EF或者0x000001C0~0x000001DF,则表示该PES_packet结束;通过分析所述mpg文件格式中的pack和pack中的PES_packets,分离出所述mpg文件中的视频信息和音频信息;步骤2,获取:获取所述视频信息中的一帧图像:利用算法,获取需要的目标(比如人物,车,或其他事先训练好的AI模型)在所述图像中的位置(能否阐述获取一帧图片的算法),随后除去目标,获取所述图像的其他元素并视为所述图像的背景,所述背景存储为文件并命名文件
名为时间戳.png;同样以mpg文件格式为例,在每个PES_packet中,获取包含时间标记的时间信息,从所述时间信息中识别出PES_packet中包含哪些时间节点的图像,再从所述PES_packet中单独提出某一帧的图像,同时确认压缩的精度,比如是否需要精确捕捉人物的动作,作为参数输入步骤2;步骤3,提取:利用提前训练好的神经网络模型(参照压缩算法模型步骤),从每一帧中提取出需要保存的信息,比如人物A在该帧图像中的位置(x,y,z),物体Z在该帧图像中的位置(x,y,z);通过和之前的压缩结果对比,分析所述需要保存的信息如人物A或者物体Z是否出现过在之前的图像中,如果没有出现过,保存所述需要保存的信息的截图,命名为peopleA.jpg或objectZ.jpg,或者类似能识别的命名方式,每一帧压缩完的类json文件格式,取名为kson;如果需要压缩精度较高,则提高同一个人物相似度的判断(比如挥手和走路视为不同的动作),需要保存图片命名为peopleAActionA.jpg;步骤4,压缩:获取下一帧,比较背景相似度,如果背景没有变化,重复步骤2和3,但其中的存储背景不重复进行,如果背景有变化,需再存一张背景,如此直至完成压缩;二、解压缩时,按如下步骤依次实施:步骤1:读取上述描写的文字文件格式,读取一个kson还原一张图片,还原方法为利用算法,参考解压算法训练步骤,把背景和文字中物体和人物结合,通过预存的背景和人物/物体图像结合生成还原成目标精度的图像;还原的算法是通过机器学习生成的算法,输入为解压算法产生的数据,输出为连续的图片,通过时间戳升序排序,再结合音频信息,合成视频信息;生成的图像和原图像相似度通过SIFT、SURF等公开的算法去计算,使原图像和生成图像所表达的意义相同;步骤2:读取下一个kson循环这个过程;步骤3:如果有音频信息,配上预存的音频信息,还原成视频文件的原有格式。
[0005]所述的基于AI算法的视频压缩和解压方法,其特征是:神经网络模型训练按如下步骤依次实施:步骤1:确定目标视频压缩内容所要保存的信息(比如视频中只想要保留出现过的人物信息,或者只保留出现过的车辆信息);步骤2:准备好目标训练图像数据(比如人物/车)或者利用第三方准备好的或公开的数据进行训练,利用交叉验证的方式训练(循环取90%的图像作为训练数据,剩余的10%作为测试
数据,保证每10%的数据都会被当做测试数据测试);利用卷积神经网络按如下a~e训练:a. 确认网络模型,包括网络有几层,哪些是卷积层,池化层,激活层,全连接层,b. 初始化神经网络,随机初始化每一个神经元的连接权重,以及隐含层阈值和输出层阈值,并给定学习速率和激活层函数确定,c. 正向传播计算,d. 误差计算并方向传播优化模型,e. 判断算法是否迭代结束,即是否达到目标准确度,如果不是则重复c~d;步骤3:测试模型准确率,利用准备好的测试数据,测试准确度,循环模型训练步骤b~e,直到所有数据都测试完毕,至此模型可以以不低于95%的准确率来识别输入图像中是否有目标物体,并可以确定长方形轮廓。
[0006]所述的基于AI算法的视频压缩和解压方法,其特征是:一、压缩时:步骤1中:所述视频文件为mpg格式,如果mpg文件以0x000001B3作为起始码,则所述mpg文件只包括视频信息,如果以0x000001BA为开头,则所述mpg文件包括视频信息和音频信息;一个mpg文件内有多个pack,每个pack即为一个已被分割开的mpg文件,如果遇到0x000001BA或者0x000001B3,则表示一个pack结束,一个pack内会包含pack_header,system_hader以及PES_packets,PES_packets是包含图像信息和音频信息的数据包;如果PES_packets开头为0x000001E0~0x000001EF,则表示是所述mpg文件中视频信息的PES起始代码,如果为0x000001C0~0x000001DF,则表示是所述mpg文件中音频信息的PES起始代码,每一个PES_packet遇到下一个0x000001E0~0x000001EF或者0x000001C0~0x000001DF,则表示该PES_packet结束;通过分析所述mpg文件格式中的pack和pack中的PES_packets,分离出所述mpg文件中的视频本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于AI算法的视频压缩和解压方法,包括一、压缩和二、解压缩,其特征是:一、压缩时,按如下步骤依次实施:步骤1,分析:通过视频codec分析视频文件,获取所述视频文件中的视频信息,并判断所述视频文件是否包含音频信息,如果所述视频文件包含音频信息,则利用所述视频文件的格式所对应的编译器算法,分离出音频信息;步骤2,获取:获取所述视频信息中的一帧图像:利用算法,获取需要的目标在所述图像中的位置,随后除去目标,获取所述图像的其他元素并视为所述图像的背景,所述背景存储为文件并命名文件名为时间戳.png;步骤3,提取:利用提前训练好的神经网络模型,从每一帧中提取出需要保存的信息;通过和之前的压缩结果对比,分析所述需要保存的信息是否出现过在之前的图像中,如果没有出现过,保存所述需要保存的信息的截图,命名为peopleA.jpg或objectZ.jpg,或者类似能识别的命名方式,每一帧压缩完的类json文件格式,取名为kson;如果需要压缩精度较高,则提高同一个人物相似度的判断,需要保存图片命名为peopleAActionA.jpg;步骤4,压缩:获取下一帧,比较背景相似度,如果背景没有变化,重复步骤2和3,但其中的存储背景不重复进行,如果背景有变化,需再存一张背景,如此直至完成压缩;二、解压缩时,按如下步骤依次实施:步骤1:读取上述描写的文字文件格式,读取一个kson还原一张图片,还原方法为利用算法,参考解压算法训练步骤,把背景和文字中物体和人物结合,通过预存的背景和人物/物体图像结合生成还原成目标精度的图像;还原的算法是通过机器学习生成的算法,输入为解压算法产生的数据,输出为连续的图片,通过时间戳升序排序,再结合音频信息,合成视频信息;生成的图像和原图像相似度通过SIFT或SURF算法去计算,使原图像和生成图像所表达的意义相同;步骤2:读取下一个kson循环这个过程;步骤3:如果有音频信息,配上预存的音频信息,还原成视频文件的原有格式。2.如权利要求1所述的基于AI算法的视频压缩和解压方法,其特征是:神经网络模型训练按如下步骤依次实施:步骤1:确定目标视频压缩内容所要保存的信息;步骤2:准备好目标训练图像数据或者利用第三方准备好的或公开的数据进行训练,利用交叉验证的方式训练;利用卷积神经网络按如下



训练:

确认网络模型(网络有几...

【专利技术属性】
技术研发人员:朱贤桢
申请(专利权)人:朱贤桢
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1