专利检索模型构建方法、装置、设备及介质制造方法及图纸

技术编号:42625316 阅读:32 留言:0更新日期:2024-09-06 01:28
本发明专利技术提供了一种专利检索模型构建方法、装置、设备及系统,其中,方法包括:将抓取的专利文献去重后存储于本地数据库内,按照特定比例划分为训练集和验证集;将训练集和验证集中的图片进行图像特征提取生成第一特征训练集和第一特征验证集,将文本进行文本特征提取生成第二特征训练集和第二特征验证集;采用多模态特征融合方法将第一特征训练集和第二特征训练集进行融合生成多特征训练集,将第一特征验证集和第二特征验证进行融合生成多特征验证集;将多特征训练集作为卷积神经网络模型的输入进行模型训练生成训练好的专利检索模型,并通过多特征验证集验证模型的有效性。本申请通过特征融合方法实现对专利的图片及文字检索。

【技术实现步骤摘要】

本文件涉及专利检索,尤其涉及一种专利检索模型的构建方法、装置、设备及系统。


技术介绍

1、专利文档中包含丰富的文本和附图信息,本质上是一种多模态的媒体类型,需要综合利用文本和图像分析方法进行精准和高效的处理。但是当前的专利检索通常基于用户输入的查询文本和专利文本的相似度匹配实现,缺乏综合利用文本和图片进行融合检索的技术手段。因此,如何从精准高效地从用户输入的文本和图片中检索出相关专利已然成为目前的一项重要研究内容。


技术实现思路

1、本专利技术提供了一种专利检索模型的构建方法、装置、设备及系统,旨在解决上述问题。

2、本专利技术实施例提供了以一种专利检索模型的构建方法,具体包括:

3、s1、将从各大平台专利数据库内抓取的专利文献去重后存储于本地数据库内进行预处理,将预处理后的专利文献按照特定比例划分为训练集和验证集;

4、s2、将训练集和验证集中的图片进行图像特征提取生成第一特征训练集和第一特征验证集;

5、s3、将训练集和验证集中的文本进行文本特征提取生成第二本文档来自技高网...

【技术保护点】

1.一种专利检索模型构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述S1具体包括:

3.根据权利要求1所述的方法,其特征在于,所述S2具体包括:

4.根据权利要求3所述的方法,所述通过训练图像特征提取模型分别对训练集和验证集中的图像、草图、简化草图进行特征提取,得到低层、中层和高层的特征图,并将低层、中层和高层的特征图按通道维相接,利用卷积和全连接层获得图像语义特征编码具体包括:

5.根据权利要求1所述的方法,其特征在于,所述S3具体包括:

6.根据权利要求1所述的方法,其特征在于,所述S4具体包括:...

【技术特征摘要】

1.一种专利检索模型构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述s1具体包括:

3.根据权利要求1所述的方法,其特征在于,所述s2具体包括:

4.根据权利要求3所述的方法,所述通过训练图像特征提取模型分别对训练集和验证集中的图像、草图、简化草图进行特征提取,得到低层、中层和高层的特征图,并将低层、中层和高层的特征图按通道维相接,利用卷积和全连接层获得图像语义特征编码具体包括:

5.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:王霄培夏欣欣孙鹏刘恺
申请(专利权)人:北京八月瓜科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1