System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及专利检索的,特别是涉及一种基于图像识别的专利检索方法及系统。
技术介绍
1、随着科技的不断发展和进步,专利的数量和种类也呈现出爆炸式的增长。对于研究人员、工程师和技术开发者来说,如何在海量的专利文献中快速、准确地找到自己所需的专利技术变得越来越重要。
2、现有的基于文本的专利检索方法虽然在一定程度上解决了这个问题,但仍然存在一些局限性。例如,一些专利的技术特征可能无法通过文本描述完全表达,导致检索结果不准确或遗漏;同时,对专利图像的检索大多是对图像整体进行检索,难以根据图像中各零件之间的拓扑关系进行相似度检索,影响检索结果的质量。
技术实现思路
1、为解决上述技术问题,本专利技术提供一种降低了传统基于文本的检索方法存在的局限性,提高了专利检索的全面性、准确性和效率的基于图像识别的专利检索方法。
2、第一方面,本专利技术提供了基于图像识别的专利检索方法,所述方法包括:
3、获取待检索专利文件的说明书附图,并对说明书附图进行零件分割,获得零件图像集合;所述零件图像集合包括专利文件中记载的每个零件的独立图像;
4、获取待检索专利文件的说明书,并提取说明书中记载的零件附图标记和零件特征描述;
5、结合专利文件的附图标记,对每个零件的独立图像进行聚类分析,确定每个零件所属类型;
6、根据零件特征描述和相邻零件之间的空间关系,对所有零件进行拓扑分析,获得专利技术方案拓扑图;在所述专利技术方案拓扑图中,每个零件
7、将专利技术方案拓扑图在预先构建的专利拓扑图数据库中进行相似度遍历,提取并汇总相似度超过预设阈值的专利文件,获得对比文件集合;
8、将对比文件集合中的所有专利文件按相似度排序,并进行可视化展示。
9、进一步地,所述零件图像集合获取方法包括:
10、通过专利数据库和专利办公机构的在线平台获取待检索专利文件的电子版本,包括专利说明书以及相关的说明书附图;
11、对于获取的说明书附图,进行图像预处理,包括图像去噪、调整亮度和调整对比度,确保后续的图像分割和分析步骤能够在高质量的图像基础上进行;
12、通过图像分割算法,将整个图像分解成包含单个零件的独立图像;
13、分割后,将得到的单个零件图像组成零件图像集合,每个零件图像都应是专利文件中对应零件的独立表示;
14、将零件图像集合存储在数据库中,以便后续步骤的处理使用。
15、进一步地,所述零件附图标记和零件特征描述提取方法包括:
16、待检索专利文件以pdf的形式存在,通过使用光学字符识别技术识别图像中的文字,并将其转化为文本数据;
17、使用自然语言处理技术来理解文本数据中的语法、语义和上下文,分析说明书中记载的零件附图标记和零件特征描述;
18、采用关键词提取技术,从专利说明书中提取与零件相关的关键信息,发现描述零件特征的短语和关联词汇,构建更全面的零件特征描述;
19、建立一个数据模型,将零件标记和特征描述与相应的零件图像进行关联,以结构化的形式存储。
20、进一步地,所述零件所属类型确定方法包括:
21、利用零件附图标记信息,将每个零件图像与其在说明书中的标记关联起来,建立图像与文本信息之间的对应关系;
22、使用卷积神经网络对每个零件图像进行特征提取,提取图像的视觉特征,捕捉零件的形状和纹理;
23、利用聚类算法,对提取的零件图像特征进行分组,将相似的零件图像分配到同一类别,形成不同的零件类型簇;
24、通过对每个聚类簇进行分析,进一步分析图像的上下文信息、形状特征以及与文本描述的对应关系,确定每个零件所属的具体类型。
25、进一步地,所述专利技术方案拓扑图获取方法包括:
26、通过分析零件的相邻关系,构建零件之间的空间关系图,包括零件之间的相对位置和连接方式;
27、利用空间关系图,开始构建专利技术方案的拓扑图,每个零件作为图中的节点,相邻关系构成图的边,展示出专利技术方案中各零件之间的空间结构和连接方式;
28、在拓扑图的构建过程中,在每个零件节点上都标注上其所属的类型。
29、进一步地,所述专利拓扑图数据库构建方法包括:
30、通过专利数据库、专利局网站和其他专利信息服务提供商获取大量专利文献数据,构建更全面的数据库;
31、对专利文献进行文本清理,包括去除特殊符号和停用词,提取关键信息;对获取的图像进行预处理,包括调整图像大小、去噪和标准化;
32、从专利文献中提取关键词和技术特征描述信息,构建文本特征;对图像进行特征提取,提取零件的形状和纹理特征;
33、根据专利文献中的附图标记信息,对零件图像进行识别和连接,构建零件之间的拓扑关系,将每个零件标注为特定的类型;
34、建立图数据库结构,将拓扑图、文本特征和图像特征组织起来;
35、对数据库中的关键字段建立索引,提高查询效率;
36、验证构建的拓扑图数据库的准确性和完整性,确保图结构、标注和特征都与原始专利文献相符;
37、定期更新拓扑图数据库,确保数据库中的信息保持最新。
38、进一步地,所述可视化展示方法包括:
39、设计一个用户友好的交互式界面,使用户能够轻松地浏览和分析排序后的专利文件;
40、提供过滤工具,让用户根据自己的需求,快速筛选结果,所述用户需求包括专利申请年份、专利持有人、
、专利名称、关键字和专利申请号;
41、使用图形化手段展示拓扑图,通过不同颜色和形状标示不同类型的零件,使用线条显示零件之间的连接关系;
42、允许用户选择特定的专利并将其与其他专利并排显示,以便于比较和分析;
43、点击任一专利时,能够提供该专利的详细信息;
44、允许用户导出搜索结果,以便于进一步的分析和进行报告编制。
45、另一方面,本申请还提供了基于图像识别的专利检索系统,所述系统包括:
46、图像获取模块,用于获取待检索专利文件的说明书附图,并发送;
47、图像分割模块,用于接收待检索专利文件的说明书附图,对说明书附图进行零件分割,获得零件图像集合,并发送;
48、信息提取模块,用于获取待检索专利文件的说明书,提取说明书中记载的零件附图标记和零件特征描述,并发送;
49、聚类分析模块,用于接收零件附图标记和零件图像集合,结合专利文件的附图标记,对每个零件的独立图像进行聚类分析,确定每个零件所属类型,并发送;
50、拓扑分析模块,用于接收零件特征描述和每个零件所属类型,根据零件特征描述和相邻零件之间的空间关系,对所有零件进行拓扑分析,获得专利技术方案拓扑图,并发送;在所述专利技本文档来自技高网...
【技术保护点】
1.一种基于图像识别的专利检索方法,其特征在于,所述方法包括:
2.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述零件图像集合获取方法包括:
3.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述零件附图标记和零件特征描述提取方法包括:
4.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述零件所属类型确定方法包括:
5.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述专利技术方案拓扑图获取方法包括:
6.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述专利拓扑图数据库构建方法包括:
7.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述可视化展示方法包括:
8.一种基于图像识别的专利检索系统,其特征在于,所述系统包括:
9.一种基于图像识别的专利检索电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述方法中的步骤。
...【技术特征摘要】
1.一种基于图像识别的专利检索方法,其特征在于,所述方法包括:
2.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述零件图像集合获取方法包括:
3.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述零件附图标记和零件特征描述提取方法包括:
4.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述零件所属类型确定方法包括:
5.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述专利技术方案拓扑图获取方法包括:
6.如权利要求1所述的基于图像识别的专利检索方法,其特征在于,所述专利拓扑图数据库构建方法包括...
【专利技术属性】
技术研发人员:贺奎,向远周,陈薇,
申请(专利权)人:深圳蚁群人电子网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。