一种基于文本图像内容感知的图像重定向方法技术

技术编号：42305934 阅读：23 留言：0更新日期：2024-08-14 15:52

本发明专利技术涉及一种基于文本图像内容感知的图像重定向方法。包括：(1)构建数据集：使用基于文本二值化的掩码图像生成方法对图像进行处理，生成对应的文本掩码图像数据集，将彩色文本图像及其掩码图像进行训练集和测试集的划分；(2)构建网络模型：应用Transformer架构，分别提取文本特征和图像特征，通过特征融合和通道注意力机制识别关键信息，有效指导重定向过程；(3)训练网络模型：采用循环重构策略，将重定向结果反向输入网络以优化和指导模型训练；(4)获得实验结果：本发明专利技术相较于其他方法，可以显著提升文本图像的重定向效果，有效保持文本区域的完整性，优化图像的视觉质量，特别适用于多媒体、广告和用户界面设计等领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域图像处理技术，尤其是针对文本图像的图像重定向方法。

技术介绍

1、当前，图像在日常生活中承载着大量的信息。从社交媒体分享、在线广告展示到新闻报道和教育培训，不同应用场景往往需要图像展示在不同尺寸的显示设备上，如手机、电视、平板电脑、笔记本电脑等。然而，图像显示设备之间往往具有较大的差异性，有不同的分辨率，而图像通常依据一定的宽高比例固定尺寸，缺乏自适应改变的能力，导致原始图像在不同设备上的显示可能与屏幕规格不匹配。在此背景下，为了优化图像在目标设备上的呈现效果，必须对其进行适当调整，图像重定向技术应运而生。

2、基于传统方法的图像重定向技术为图像尺寸和纵横比调整提供了多种可能。均匀缩放利用插值方法调整图像大小但可能导致信息变形，图像裁剪则侧重于移除边缘内容以改变尺寸或纵横比，但会导致信息丢失。为克服这些限制，在过去的几十年里，以内容感知方法[1][2][3][4][5]为代表得到了广泛的研究。这些方法根据图像中像素的重要级别执行重定向操作，旨在保护视觉上的关键区域，保持图像内容的完整性和自然性。尽...

【技术保护点】

1.一种基于文本图像内容感知的图像重定向方法，具体包括下列步骤：

【技术特征摘要】

1.一种基于文本图像内容感知的图...

【专利技术属性】
技术研发人员：潘刚，潘力铭，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人