System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及专利检索领域,特别涉及一种基于深度学习的专利检索方法及系统。
技术介绍
1、越来越多的企业对专利的重要性有更清楚的认识,进而导致专利文件数量也逐步增多。在众多的专利文件中检索专利文件的相关文件较为困难,在这种情况下,一种使用产品树来进行高效便捷地管理查询方法油然而生。
2、目前基于关键字和语义分析的专利检索方法会受限于收录不够广泛的词汇表和部分情况下语义模糊的状况。
3、因此,本专利技术提供了一种基于深度学习的专利检索方法及系统。
技术实现思路
1、针对上述所显示出来的问题,本专利技术提供了一种基于深度学习的专利检索方法及系统,相对于传统的关键字检索和语义分析方法,基于深度学习的专利检索具有更高的准确性、覆盖率和灵活性。它可以自适应地处理不同领域的专利文本,并能够捕捉到潜在的隐藏关系,在搜索结果中提供更精确和全面的信息。
2、一种基于深度学习的专利检索方法,包括:
3、步骤1:对检索信息进行预处理得到若干个检索关键词,利用预设深度神经网络分别为每一检索关键词建立检索编码;
4、步骤2:在预设互联网中分别查找每一检索编码,得到每一所述检索编码对应的若干个文本数据;
5、步骤3:根据每一所述检索编码对应的文本数据构建相关性模型,根据所述相关性模型构建所述检索信息的第一相关文本;
6、步骤4:将用户查看的目标第一相关文本反馈到所述相关性模型中,在所述相关性模型中构建所述目标第一相关文本的第二
7、步骤5:根据模型训练结果生成训练相关性模型,在所述训练相关性模型中查找所述检索信息对应的若干个检索文本。
8、在一种可实施的方式中,
9、所述步骤1,包括:
10、步骤11:对所述检索信息进行语义分析,得到所述检索信息中包含的若干个信息词语,及所述检索信息对应的模糊语义;
11、步骤12:根据所述模糊语义生成若干个语义词语;
12、步骤13:将所述信息词语和所述语义词语记作待编码词,对所述待编码词语进行聚类分析,得到若干个词语类;
13、步骤14:分别对每一词语类中的聚类词进行首次编码和二次编码,生成每一所述待编码词对应的检索编码。
14、在一种可实施的方式中,所述步骤14,包括:
15、步骤141:根据每一词语类对应的词性为所述待编码词语进行首次编码;
16、步骤142:根据获取待编码词语对应的词义,在预设互联网中分别查找每一所述词义,得到每一所述词义对应的查找结果数;
17、步骤143:根据查找结果数由高到低的顺序为每一所述词义建立重要权重,根据所述重要权重由高到低的顺序对对应的所述待编码词语进行二次编码;
18、步骤144:根据所述首次编码和二次编码生成每一所述待编码词语的检索编码。
19、在一种可实施的方式中,
20、所述步骤2,包括:
21、步骤21:解析所述检索编码构建所述检索编码的查找顺序,以及分别为每一所述检索编码匹配对应的查找方式;
22、步骤22:根据所述查找顺序为查找方式相同的所述检索编码进行重构排序,同时启动每一所述查找方式,根据所述重构排序对应的重构顺序查找每一所述检索编码;
23、步骤23:获取每一检索编码对应的若干个检索数据,分别获取每一检索数据对应的数据来源;
24、步骤24:根据所述数据来源确定对应检索数据的解码方式,根据所述解码方式将所述检索数据转换为文本数据。
25、在一种可实施的方式中,
26、所述步骤3,包括:
27、步骤31:为每一所述检索编码对应的文本数据建立第一数据序列,并分别获取每一所述第一数据序列进行数据滤波,得到对应的第二数据序列;
28、步骤32:分别获取每一所述第二数据序列对应的序列规格,根据所述序列规格建立模型框架;
29、步骤33:将所述第二数据序列输入到所述模型框架中构建相关性模型;
30、步骤34:在所述相关性模型提取与所述检索信息相关度大于预设相关度的文本数据,建立所述检索信息的第一相关文本。
31、在一种可实施的方式中,
32、所述步骤4,包括:
33、步骤41:当所述用户查看所述第一相关文本时,提取查看时长大于预设时长阈值的目标第一相关文本;
34、步骤42:将所述目标第一相关文本反馈到所述相关性模型中,在所述相关性模型中对所述目标第一相关文本进行第一加重标记;
35、步骤43:在所述相关性模型中分析每一所述第一相关文本对所述目标第一相关文本之间的相关度,将相关度大于预设相关度阈值的第一相关文本记作第二相关文本;
36、步骤44:对所述第二相关文本进行第二加重标记。
37、在一种可实施的方式中,
38、所述步骤5,包括:
39、步骤51:根据模型训练结果查找所述相关性模型中包含的所有第一加重标记和第二加重标记,生成训练相关性模型;
40、步骤52:统计所述训练相关性模型中每一所述第一加重标记对应的第三相关文本和每一所述第二加重标记对应的第四相关文本;
41、步骤53:根据所述第三相关文本和第四相关文本构建所述检索信息对应的若干个检索文本。
42、本实施例提供了一种基于深度学习的专利检索系统,包括:
43、分词编码模块,用于对检索信息进行预处理得到若干个检索关键词,利用预设深度神经网络分别为每一检索关键词建立检索编码;
44、查找分析模块,用于在预设互联网中分别查找每一检索编码,得到每一所述检索编码对应的若干个文本数据;
45、模型构建模块,用于根据每一所述检索编码对应的文本数据构建相关性模型,根据所述相关性模型构建所述检索信息的第一相关文本;
46、模型训练模块,用于将用户查看的目标第一相关文本反馈到所述相关性模型中,在所述相关性模型中构建所述目标第一相关文本的第二相关文本,完成模型训练;
47、检索整合模块,用于根据模型训练结果生成训练相关性模型,在所述训练相关性模型中查找所述检索信息对应的若干个检索文本。
48、本专利技术可以实现的有益效果为:基于深度学习的专利检索可以通过学习大量文本数据来建立多层次的抽象表示,具体来说,可以使用深度神经网络对输入的专利文本进行编码,然后通过构建相关性模型来实现检索需求,首先对检索信息进行预处理得到其检索关键词,然后为每一检索关键词建立检索编码再进行查找,根据查找到的文本数据构建相关性模型,进一步利用用户所查看文本的相关文本对模型进行训练,最后可以得到检索信息所对应的若干个检索文本,从而更好地理解专利文本中的含义。
49、本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或本文档来自技高网...
【技术保护点】
1.一种基于深度学习的专利检索方法,其特征在于,包括:
2.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤1,包括:
3.如权利要求2所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤14,包括:
4.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤2,包括:
5.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤3,包括:
6.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤4,包括:
7.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤5,包括:
8.一种基于深度学习的专利检索系统,其特征在于,包括:
9.根据权利要求8所述的专利检索系统,其特征在于,所述分词编码模块,还用于执行如下步骤:
10.如权利要求9所述的专利检索系统,其特征在于,所述步骤14,包括:
【技术特征摘要】
1.一种基于深度学习的专利检索方法,其特征在于,包括:
2.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤1,包括:
3.如权利要求2所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤14,包括:
4.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤2,包括:
5.如权利要求1所述的一种基于深度学习的专利检索方法,其特征在于,所述步骤3,包括:<...
【专利技术属性】
技术研发人员:兰雨晴,余丹,张博煜,邢智涣,
申请(专利权)人:慧之安信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。