基于自然语言引导的场景自适应视频压缩方法及系统技术方案

技术编号:43377896 阅读:21 留言:0更新日期:2024-11-19 17:56
本发明专利技术公开了一种基于自然语言引导的场景自适应视频压缩方法及系统,该方法包括获取原始视频数据流,解析为连续的视频帧序列;获取与场景相关的自然语言引导文本,确定当前场景的类型,生成增强后的场景描述文本;使用场景分类系统进行深度分析,生成场景特征向量;与预训练的大语言模型结合,生成优化策略;提取局部和全局特征,生成综合特征图;进行运动估计,生成运动向量和残差信息;融和生成复合特征图;使用分水岭算法生成掩膜;对复合特征图进行自适应压缩,输出特征数据;采用上下文自适应二进制算术编码进行进一步的数据压缩,输出压缩数据比特流。本发明专利技术提升了视频压缩的效率和压缩后视频的质量,实现了在不同场景下的智能视频压缩。

【技术实现步骤摘要】

本专利技术属于视频压缩领域,尤其是基于自然语言引导的场景自适应视频压缩方法及系统


技术介绍

1、随着数字视频内容的广泛应用,视频压缩技术变得越来越重要。其中,电力巡检是一个需要频繁采集和传输视频数据的场景。电力巡检通常涉及对电力设备和输电线路进行监测和维护,以确保电网的安全和稳定运行。在这个过程中,视频数据的高效传输和存储对于准确识别问题和快速决策至关重要。视频压缩旨在通过减少数据量,降低传输带宽需求和存储成本,同时保持可接受的视觉质量,以实现高效的视频传输和存储。然而,传统的视频压缩方法存在一些挑战,如固定的压缩算法和参数,无法适应不同场景和内容的特点,导致在某些情况下产生质量损失或低效的压缩。

2、传统的视频压缩方法在电力巡检场景中存在一些挑战,首先,压缩倍率是一个重要的指标,决定了视频数据的压缩程度。较高的压缩倍率可以减少数据传输和存储成本,但可能导致视觉质量下降和细节失真增加,影响电力巡检问题的准确识别。因传统方法通常采用固定的压缩倍率,无法根据具体场景的特点进行灵活调整,无法充分平衡压缩效率和图像质量。同时,电力巡检涉及不同的场景,本文档来自技高网...

【技术保护点】

1.基于自然语言引导的场景自适应视频压缩方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤S1进一步为:

3.根据权利要求2所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤S2进一步为:

4.根据权利要求3所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤S3进一步为:

5.根据权利要求4所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤S4进一步为:

6.根据权利要求5所述的基于自然语言引导的场景自适应视频压缩方法,其...

【技术特征摘要】

1.基于自然语言引导的场景自适应视频压缩方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤s1进一步为:

3.根据权利要求2所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤s2进一步为:

4.根据权利要求3所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤s3进一步为:

5.根据权利要求4所述的基于自然语言引导的场景自适应视频压缩方法,其特征在于,步骤s4进一步为:

6.根据权利要求5所述...

【专利技术属性】
技术研发人员:冷聪魏学备海雷
申请(专利权)人:中科方寸知微南京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1