System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 专利检索模型构建方法、装置、设备及介质制造方法及图纸_技高网

专利检索模型构建方法、装置、设备及介质制造方法及图纸

技术编号:42625316 阅读:25 留言:0更新日期:2024-09-06 01:28
本发明专利技术提供了一种专利检索模型构建方法、装置、设备及系统,其中,方法包括:将抓取的专利文献去重后存储于本地数据库内,按照特定比例划分为训练集和验证集;将训练集和验证集中的图片进行图像特征提取生成第一特征训练集和第一特征验证集,将文本进行文本特征提取生成第二特征训练集和第二特征验证集;采用多模态特征融合方法将第一特征训练集和第二特征训练集进行融合生成多特征训练集,将第一特征验证集和第二特征验证进行融合生成多特征验证集;将多特征训练集作为卷积神经网络模型的输入进行模型训练生成训练好的专利检索模型,并通过多特征验证集验证模型的有效性。本申请通过特征融合方法实现对专利的图片及文字检索。

【技术实现步骤摘要】

本文件涉及专利检索,尤其涉及一种专利检索模型的构建方法、装置、设备及系统。


技术介绍

1、专利文档中包含丰富的文本和附图信息,本质上是一种多模态的媒体类型,需要综合利用文本和图像分析方法进行精准和高效的处理。但是当前的专利检索通常基于用户输入的查询文本和专利文本的相似度匹配实现,缺乏综合利用文本和图片进行融合检索的技术手段。因此,如何从精准高效地从用户输入的文本和图片中检索出相关专利已然成为目前的一项重要研究内容。


技术实现思路

1、本专利技术提供了一种专利检索模型的构建方法、装置、设备及系统,旨在解决上述问题。

2、本专利技术实施例提供了以一种专利检索模型的构建方法,具体包括:

3、s1、将从各大平台专利数据库内抓取的专利文献去重后存储于本地数据库内进行预处理,将预处理后的专利文献按照特定比例划分为训练集和验证集;

4、s2、将训练集和验证集中的图片进行图像特征提取生成第一特征训练集和第一特征验证集;

5、s3、将训练集和验证集中的文本进行文本特征提取生成第二特征训练集和第二特征验证集;

6、s4、采用多模态特征融合方法将第一特征训练集和第二特征训练集进行融合生成多特征训练集;采用多模态特征融合方法将第一特征验证集和第二特征验证进行融合生成多特征验证集;

7、s5、将所述多特征训练集作为卷积神经网络模型的输入进行模型训练生成训练好的专利检索模型,并通过多特征验证集验证模型的有效性。

8、本专利技术实施例提供了以一种专利检索模型的构建装置,具体包括:

9、数据获取模块,用于将从各大平台专利数据库内抓取的专利文献去重后存储于本地数据库内进行预处理,将预处理后的专利文献按照特定比例划分为训练集和验证集;

10、图像特征提取模块,将训练集和验证集中的图片进行图像特征提取生成第一特征训练集和第一特征验证集;

11、文本特征提取模块,用于将训练集和验证集中的文本进行文本特征提取生成第二特征训练集和第二特征验证集;

12、特征融合模块,用于采用多模态特征融合方法将第一特征训练集和第二特征训练集进行融合生成多特征训练集;采用多模态特征融合方法将第一特征验证集和第二特征验证进行融合生成多特征验证集;

13、模型构建模块,将所述多特征训练集作为卷积神经网络模型的输入进行模型训练生成训练好的专利检索模型,并通过多特征验证集验证模型的有效性。

14、本专利技术实施例还提供了一种电子设备,包括:

15、处理器;以及,

16、被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行上述专利检索模型构建方法的步骤。

17、本专利技术实施例还提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现上述专利检索模型构建方法的步骤。

18、采用本专利技术实施例通过将从各大平台专利数据库内抓取的专利文献进行去重提高模型的构建速度,通过将专利文献的图像特征及文字特征进行提取后再通过多模态特征融合方法使得专利检索能够同时兼顾文字与图片,提高专利检索的准确度。

本文档来自技高网...

【技术保护点】

1.一种专利检索模型构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述S1具体包括:

3.根据权利要求1所述的方法,其特征在于,所述S2具体包括:

4.根据权利要求3所述的方法,所述通过训练图像特征提取模型分别对训练集和验证集中的图像、草图、简化草图进行特征提取,得到低层、中层和高层的特征图,并将低层、中层和高层的特征图按通道维相接,利用卷积和全连接层获得图像语义特征编码具体包括:

5.根据权利要求1所述的方法,其特征在于,所述S3具体包括:

6.根据权利要求1所述的方法,其特征在于,所述S4具体包括:

7.根据权利要求1所述的方法,其特征在于,所述专利检索模型构建方法进一步通过最小化损失函数来优化卷积神经网络模型的参数。

8.一种专利检索模型构建装置,其特征在于,包括:

9.一种电子设备,包括:

10.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现如权利要求1-7中任一项所述的专利检索模型构建方法的步骤。

【技术特征摘要】

1.一种专利检索模型构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述s1具体包括:

3.根据权利要求1所述的方法,其特征在于,所述s2具体包括:

4.根据权利要求3所述的方法,所述通过训练图像特征提取模型分别对训练集和验证集中的图像、草图、简化草图进行特征提取,得到低层、中层和高层的特征图,并将低层、中层和高层的特征图按通道维相接,利用卷积和全连接层获得图像语义特征编码具体包括:

5.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:王霄培夏欣欣孙鹏刘恺
申请(专利权)人:北京八月瓜科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1