文字图像匹配方法、装置和设备及计算机存储介质制造方法及图纸

技术编号:26259968 阅读:28 留言:0更新日期:2020-11-06 17:55
本申请公开了一种文字图像匹配方法、装置和设备及计算机存储介质,涉及计算机技术领域,用于如何提升文字图像的同源匹配的准确性。该方法包括:分别对待匹配的两个文字图像进行文字区域检测,得到每个文字图像的文字区域特征矩阵;分别针对每个文字图像,将文字图像的像素矩阵与文字区域特征矩阵进行叠加,得到每个文字图像对应的叠加矩阵;根据两个文字图像分别对应的叠加矩阵,获取两个文字图像之间的视觉相似度;根据视觉相似度确定两个文字图像是否为同源图像,这样,结合文字区域位置来判断两文字图像之间的视觉相似度,能够提升文字区域的关注度,从而提升视觉相似度的可靠性以及同源匹配的准确性。

【技术实现步骤摘要】
文字图像匹配方法、装置和设备及计算机存储介质
本申请涉及计算机
,尤其涉及图像处理
,提供一种文字图像匹配方法、装置和设备及计算机存储介质。
技术介绍
目前,互联网时代中大量的数据都是由用户自己根据需求产生的,例如网站中发布的一张文字图像,可能被不同用户进行各种涂抹或者修改等操作,从而产生大量的相似文字图像在网络中进行传播。而有时候用户会有根据一张图去获取其他同源图的需求,如由一张经过涂抹或者修改的文字图像去检索匹配到源图,或者检索该文字图像发布的网站等。可见,准确的进行文字图像的同源匹配才能检索到正确的文字图像,但是,在实际检索过程中,文字图像往往是经涂抹或者修改等操作之后产生的,这些对文字图像的操作会在文字图像中增加干扰信息,从而对文字图像的同源匹配产生干扰,增加同源匹配的难度。因此,如何提升文字图像的同源匹配的准确性是目前需要考虑的问题。
技术实现思路
本申请实施例提供一种文字图像匹配方法、装置和设备及计算机存储介质,用于如何提升文字图像的同源匹配的准确性。一方面,提供一种文字图像匹配方法,本文档来自技高网...

【技术保护点】
1.一种文字图像匹配方法,其特征在于,所述方法包括:/n分别对待匹配的两个文字图像进行文字区域检测,得到每个文字图像的文字区域特征矩阵,所述文字区域特征矩阵表征文字所在的文字区域;/n分别针对每个文字图像,将文字图像的像素矩阵与文字区域特征矩阵进行叠加,得到每个文字图像对应的叠加矩阵;/n根据所述两个文字图像分别对应的叠加矩阵,获取所述两个文字图像之间的视觉相似度;/n根据所述视觉相似度确定所述两个文字图像是否为同源图像。/n

【技术特征摘要】
1.一种文字图像匹配方法,其特征在于,所述方法包括:
分别对待匹配的两个文字图像进行文字区域检测,得到每个文字图像的文字区域特征矩阵,所述文字区域特征矩阵表征文字所在的文字区域;
分别针对每个文字图像,将文字图像的像素矩阵与文字区域特征矩阵进行叠加,得到每个文字图像对应的叠加矩阵;
根据所述两个文字图像分别对应的叠加矩阵,获取所述两个文字图像之间的视觉相似度;
根据所述视觉相似度确定所述两个文字图像是否为同源图像。


2.如权利要求1所述的方法,其特征在于,所述方法还包括:
分别对所述两个文字图像进行文字识别,得到每个文字图像对应的文字信息;
根据所述两个文字图像分别对应的文字信息,获取所述两个文字图像之间的文字相似度;
所述根据所述两个文字图像分别对应的视觉相似度确定所述两个文字图像是否为同源图像,包括:
根据所述视觉相似度以及所述文字相似度,确定所述两个文字图像是否为同源图像。


3.如权利要求2所述的方法,其特征在于,所述根据所述两个文字图像分别对应的文字信息,获取所述两个文字图像之间的文字相似度,包括:
获取所述两个文字图像分别对应的文字信息之间的编辑距离;所述编辑距离为将一文字信息转变为另一文字信息所需的编辑步数;
基于所述编辑距离确定所述两个文字图像之间的文字相似度。


4.如权利要求2所述的方法,其特征在于,根据所述视觉相似度以及所述文字相似度,确定所述两个文字图像是否为同源图像,包括:
若所述视觉相似度大于所述文字相似度,且所述视觉相似度大于第一相似度阈值,所述文字相似度大于第二相似度阈值时,确定所述两个文字图像为同源图像;所述第一相似度阈值大于所述第二相似度阈值;或者,
若所述视觉相似度小于所述文字相似度,且所述视觉相似度大于第三相似度阈值,所述文字相似度大于第四相似度阈值时,确定所述两个文字图像为同源图像;所述第三相似度阈值小于所述第四相似度阈值。


5.如权利要求1所述的方法,其特征在于,所述分别对待匹配的两个文字图像进行文字区域检测,得到每个文字图像的文字区域特征矩阵,包括:
分别对所述两个文字图像进行特征提取,得到每个文字图像对应的图像特征;
分别根据每个文字图像对应的图像特征,检测每个文字图像中包括的文字,得到每个文字图像包括的多个文本检测框;文本检测框表示文字所在的文字区域;
分别根据每个文字图像包括的多个文本检测框,得到每个文字图像对应的文字区域特征矩阵。


6.如权利要求1所述的方法,其特征在于,根据所述两个文字图像分别对应的叠加矩阵,获取所述两个文字图像之间的视觉相似度,包括:
根据所述两个文字图像分别对应的叠加矩阵,通过已训练的视觉相似度确定模型,确定所述两个文字图像之间的视觉相似度;
其中,所述视觉相似度确定模型是利用多个图像样本对训练得到的,每一所述图像样本对包括两个文字图像样本,且每一所述图像样本对标注了两个文字图像样本之间的视觉相似度,图像样本对包括的文字图像样本是在对应的源文字图像上添加了干扰信息得到的图像。


7.如权利要求6所述的方法,其特征在于,所述视觉相似度确定模型包括模型结构相同的两个特征提取子模型和相似度确定子模型;
通过所述多个图像样本对对所述视觉相似度确定模型进行多次训练,得到所述视觉相似度确定模型;其中,每一次训练过程包括如下步骤:
通过所述两个特征提取子模型分别对每一图像样本对包括的两个文字图像样本进行特征提取,得到每一图像样本对包括的两个文字图像样本的特征向量;
基于每一图像样本对包括的两个文字图像样本的特征向量,通过所述相似度确定子模型确定每一图像样本对包括的两个文字图像样本之间的视觉相似度;
确定所述视觉相似度确定...

【专利技术属性】
技术研发人员:汪翔黄珊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1