【技术实现步骤摘要】
一种智能快速帧间编码方法
本专利技术涉及深度学习、视频编码领域,尤其涉及一种智能快速帧间编码方法。
技术介绍
视频是信息传播的重要载体。近年来,随着互联网和多媒体技术飞速发展,硬件设备性能的不断提升,高清、超高清以及全景视频的应用场景愈发广泛。然而,这些数据量更大的视频为存储和传输带来极大的挑战。视频压缩编码技术有助于解决庞大的视频数据量与有限的传输带宽之间的矛盾。通过高效的视频压缩编码技术,可以去除视频中存在的冗余信息,降低视频对高传输带宽的需求。然而,视频编码过程计算复杂度高,成为制约视频压缩编码技术在实时场景应用中的瓶颈。为了尽可能降低编码视频需要的时间,新一代视频编码标准已经集成了一些低复杂度编码工具。随着人工智能的发展,深度学习技术在计算机视觉等领域取得了显著成就,这为视频低复杂度编码提供了新的研究思路。Tang等人提出了一种基于深度学习的形状自适应快速帧内编码单元划分决策方法,利用可变大小的池化层处理不同尺寸的编码单元。Tissier等人提出了一种基于深度学习的帧内编码块边界决策算法,通过神经网络 ...
【技术保护点】
1.一种智能快速帧间编码方法,其特征在于,所述方法包括:/n将编码单元的划分视作二分类问题,设计了一种多信息融合卷积神经网络模型作为分类器,实现编码单元划分提前终止;/n以编码单元的纹理信息和运动信息作为分类器的输入,分别经过非对称卷积核特征提取模块获取输入的特征;/n再使用基于注意力的特征融合模块得到融合的特征,最终使用分类模块根据融合特征获取分类结果;/n通过考虑编码单元的运动信息以及多信息融合网络输出的置信度作为条件,实现Merge模式早期决策。/n
【技术特征摘要】 【专利技术属性】
1.一种智能快速帧间编码方法,其特征在于,所述方法包括:
将编码单元的划分视作二分类问题,设计了一种多信息融合卷积神经网络模型作为分类器,实现编码单元划分提前终止;
以编码单元的纹理信息和运动信息作为分类器的输入,分别经过非对称卷积核特征提取模块获取输入的特征;
再使用基于注意力的特征融合模块得到融合的特征,最终使用分类模块根据融合特征获取分类结果;
通过考虑编码单元的运动信息以及多信息融合网络输出的置信度作为条件,实现Merge模式早期决策。
2.根据权利要求1所述的一种智能快速帧间编码方法,其特征在于,所述非对称卷积核特征提取模块对于不同尺寸的编码单元具有不同的结构。
3.根据权利要求1所述的一种智能快速帧间编码方法,其特征在于,所述基于注意力的特征融合模块为:
技术研发人员:张佩涵,潘兆庆,彭勃,靳登朝,雷建军,
申请(专利权)人:天津大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。