一种从红外图像中解译文字描述的方法及装置制造方法及图纸

技术编号：35186250 阅读：25 留言：0更新日期：2022-10-12 17:57

本发明专利技术提出一种从红外图像中解译文字描述的方法及装置，属于计算机视觉和红外图像处理领域。其中，所述方法包括：获取红外图像，将所述红外图像输入预设的红外图像描述网络，得到所述图像对应的文字描述，所述文字描述包含所述红外图像中的目标以及所述目标之间的关系。本发明专利技术通过从红外图像获取目标及其周围的重要热源信息，可使人们可以在任意时间、任意地点对环境信息进行捕获和解译，不再局限于可见光充足的条件下，填补了环境信息解译在暗光或无光环境下使用范围的空白，对所关心目标在弱光或无光下的捕获与描述具有极大的实用意义。义。义。

全部详细技术资料下载

【技术实现步骤摘要】
一种从红外图像中解译文字描述的方法及装置

[0001]本专利技术属于计算机视觉和红外图像处理领域，具体涉及一种从红外图像中解译文字描述的方法及装置。

技术介绍

[0002]人们实时获取环境信息是在通过接收并处理可见光的条件下进行的，当视力受损或可捕获的可见光信息较少时，就无法通过足够的信息来获取具体的环境情况。随着人工智能的迭代发展，现有技术已经可以解译可见光图像，对其中的物品进行识别并加以简单的描述，如识别家居用品、阅读和扫描文本、描述场景、识别朋友甚至可以描述其他应用程序中的图像，比如电子邮件、社交媒体程序等。而且有的对象和对象之间是存在交互的，现有技术不仅可以识别对象，比如“一个人，一条街道，一个行李箱”，还可以识别对象与对象之间的关系，比如“一个人提着一个行李箱走在街道上”。
[0003]然而，现有的将图像信息映射到文字的描述机制，所有解译均通过可见光图像进行，并且图像中需要有充足的对象和物体信息。但如果在暗光或无光条件下，可见光信息变得极为稀少，现有技术则无法通过可见光图像精准识别对象并描述其中的交互信息，存在以下缺陷：
[0004]①
从图像中解译文字描述局限于可见光较强的环境而且能通过传感器获得较多可见光信息的情况，图像中的目标特征要明显、无遮拦。当光线不足或无光而导致在相应环境下目标特征不明显的情况，现有方法无法精确、合理的得到解译图像的正确结果。
[0005]②
实时处理能力差，现有图像解译模型体量较大，对设备性能要求高，不仅需要高算力而且过于依赖通信环境，无...

【技术保护点】

【技术特征摘要】
1.一种从红外图像中解译文字描述的方法，其特征在于，包括：获取红外图像；将所述红外图像输入预设的红外图像描述网络，得到所述图像对应的文字描述，所述文字描述包含所述红外图像中的目标以及所述目标之间的关系。2.根据权利要求1所述的方法，其特征在于，在所述将所述红外图像输入预设的红外图像描述网络，得到所述图像对应的文字描述之前，还包括：训练所述红外图像描述网络；所述训练所述红外图像描述网络包括：构建红外图像训练集，所述红外图像训练集包含红外图像及对应的文字描述；构建红外图像描述网络，所述红外图像描述网络包括依次连接的CNN特征提取子网络、RNN注意力机制子网络和LSTM子网络；其中，所述CNN特征提取子网络用于提取输入图像的特征；所述RNN注意力机制子网络用于根据所述特征，从备选描述语料库中提取所述图像中目标对应的单词；所述LSTM子网络用于根据单词确定描述语句的语序；利用所述红外图像训练集训练所述红外图像描述网络，得到训练完毕的红外图像描述网络。3.根据权利要求2所述的方法，其特征在于，所述CNN特征提取子网络采用Resnet预训练模型。4.根据权利要求2所述的方法，其特征在于，所述备选描述语料库是将所述红外图像训练集中每张图像对应的文字描述拆分成单词后组成的单词集合。5.根据权利要求2所述的方法，其特征在于，所述红外图像训练集中红外图像的生成方法为：获取可见光图像集，所述可见光图像集包含可见光图像及对应的文字描述；将所述可见光图像输入预设的图像转译模型，得到对应的红外图像；将所述红外图像及对应的可见光图像的文字描述组成训练样本以构建所述红外图像训练集。6.根据权利要求5所述的方法，其特征在于，在所述将所述可见光图像输入预设的图像转译模型，得到对应的红外图像之前，还包括：训练所...

【专利技术属性】
技术研发人员：刘华平，高晨峻，袁小虎，董言治，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人