System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 针对文档中图像客体的元数据生成装置及方法、记录介质制造方法及图纸_技高网

针对文档中图像客体的元数据生成装置及方法、记录介质制造方法及图纸

技术编号:41418606 阅读:11 留言:0更新日期:2024-05-21 20:51
本公开涉及针对文档中图像客体的元数据生成装置及方法、记录介质,其特征在于,包括如下步骤:接收文档的输入;将输入的所述文档转换为图像文件;提取输入的所述文档的著录信息;提取所述输入的文档的格式信息;提取所述输入的文档中的图像区域及图像区域中的至少一个图像客体;提取所述至少一个图像客体的结构性特征点;提取所述至少一个图像客体的上下文特征点;以及基于所述著录信息、所述格式信息、所述结构性特征点及所述上下文特征点生成综合元数据。

【技术实现步骤摘要】

本公开涉及一种元数据生成装置及其方法。更详细地讲,本公开涉及一种用于验证文档中图像客体的变形及剽窃的元数据生成装置及其方法。


技术介绍

1、在计算机视觉领域中,图像之间的相似度判断可以以像素为单位来执行。具体地讲,相似度的判断可以基于原始图像和比较客体图像之间的整体像素排列一致的程度来执行。但是,在像素单位相似度判断中,在比较客体图像是对原始图像中的部分像素、规模、角度、明度、彩度等进行变形的图像的情况下,存在难以验证这种变形的问题。并且,在比较客体图像是原始图像的一部分的情况下,像素单位相似度判断存在难以验证的问题。为了弥补上述缺点,已经研发出了通过提取图像中的特征点来判断相似度的多种技术。

2、本公开的比较客体图像可以是包含在文档(例:论文、来搞)中的图像客体。在这种情况下,图像客体的种类(例:照片、图片、插图、表格、图表)以及可以施加到图像客体的变形的种类可能多种多样。因此,仅凭基于现有的像素及特征点的相似度判断,在验证文档内图像客体的变形及剽窃方面可能会存在困难。


技术实现思路

1、如上所述,为了验证文档中图像区域的变形及剽窃,在本公开中公开的的元数据生成装置的目的在于,通过将图像客体的结构性信息及上下文信息加工成综合元数据来构建数据库。

2、本公开所要解决的技术问题不限于以上提及的技术问题,本领域技术人员可以从以下记载中明确地理解未提及的其他技术问题。

3、为了解决上述技术问题,根据本公开的一方面的元数据生成方法包括如下步骤:接收文档的输入;将输入的文档转换为图像文件;提取输入的文档的著录信息;提取输入的文档的格式信息;提取输入的文档中的图像区域及图像区域中的至少一个图像客体;提取至少一个图像客体的结构性特征点;提取至少一个图像客体的上下文特征点;以及基于著录信息、格式信息、结构性特征点及上下文特征点生成综合元数据。

4、并且,著录信息可以包括输入的所述文档的标题、种类、期刊名、作者、出版社、出版地、关键词、数字客体标识符(doi:digital object identifier)、原文链接、信息链接、搜索链接、登录日期、状态代码、卷、号以及页面信息中的至少一个。

5、并且,提取输入的文档的格式信息包括如下步骤:提取输入文档的元数据;对输入的文档的形式进行分类;从输入的文档中提取字节码;分析输入的文档结构;以及生成最终格式信息,其中,分析输入的文档结构的步骤可以包括将至少一个图像客体分类为照片(picture)、图片(figure)、插图(illustration)、图表(chart)以及表格(table)中的至少一个。

6、并且,提取至少一个图像客体的结构性特征点的步骤可以包括如下步骤:利用能量阈值、强化对照、尺度不变量特征变换(sift:scale-invariant feature transform)以及加速分段测试的特征(fast:features from accelerated segment test)技术中的至少一个,提取所述至少一个图像客体的稳健的特征点(robust key point)。

7、并且,提取至少一个图像客体的上下文特征点可以包括如下步骤:基于光学字符识别(ocr:optical character recognition)技术来识别所述至少一个图像客体中包含文本的图像客体;以及基于已识别的文本信息提取详细上下文信息。

8、并且,为了实现上述技术问题,根据本公开的另一方面的元数据生成装置包括:存储器;文档输入部,用于接收文档的输入;以及控制部,控制元数据生成部的操作,其中,所述元数据生成部包括:文档转换部,将所述输入的文档转换为图像文件;著录信息提取部,提取所述输入的文档的著录信息;格式信息提取部,提取所述输入的文档的格式信息;图像区域提取部,提取所述输入的文档中的图像区域和所述图像区域中的至少一个图像客体;结构性特征提取部,提取所述至少一个图像客体的结构性特征;上下文特征提取部,提取所述至少一个图像客体的上下文特征;以及综合元数据生成部,基于所述著录信息、所述格式信息、所述结构性特征点以及所述上下文特征点生成综合元数据。

9、此外,为了执行实现本公开,还可以提供存储在计算机可读记录介质中的计算机程序。

10、此外,还可以提供一种记录介质,所述记录介质为所述计算机可读记录介质,记录用于执行本公开的元数据生成方法的计算机程序。

11、根据本公开的前述的技术方案,生成文档内图像客体特殊元数据,提供容易验证或探测由第三者引起的图像变形及剽窃的效果。

12、本专利技术的效果并不局限于以上提及的效果,本领域技术人员可以通过下文的记载而明确理解未提及的其他效果。

本文档来自技高网...

【技术保护点】

1.一种元数据生成方法,所述方法借由元数据生成装置执行,包括如下步骤:

2.根据权利要求1所述的元数据生成方法,其中,

3.根据权利要求2所述的元数据生成方法,其中,

4.根据权利要求3所述的元数据生成方法,其中,

5.根据权利要求4所述的元数据生成方法,其中,

6.一种记录介质,所述记录介质为计算机可读记录介质,记录用于执行实现根据权利要求1至权利要求5中的任意一项所述的元数据生成方法的程序。

7.一种元数据生成装置,其特征在于,包括:

8.根据权利要求7所述的元数据生成装置,其特征在于,

9.根据权利要求8所述的元数据生成装置,其特征在于,

10.根据权利要求8所述的元数据生成装置,其中,

【技术特征摘要】

1.一种元数据生成方法,所述方法借由元数据生成装置执行,包括如下步骤:

2.根据权利要求1所述的元数据生成方法,其中,

3.根据权利要求2所述的元数据生成方法,其中,

4.根据权利要求3所述的元数据生成方法,其中,

5.根据权利要求4所述的元数据生成方法,其中,

6.一种记录介质,所述记录介质...

【专利技术属性】
技术研发人员:林轩荣延昶均
申请(专利权)人:株式会社无何有
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1