System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及知识图谱数据分析领域,更具体的,涉及基于属性知识图谱的专利授权预测评估的方法和系统。
技术介绍
1、在知识产权管理领域,专利授权性预测是一个重要环节。传统的专利授权性预测主要依赖于专家经验和人工审查,这种方法不仅效率低下,而且容易受到主观因素的影响,导致预测结果的准确性和可靠性不足。随着信息化和数据挖掘技术的发展,基于数据分析的专利授权性预测方法逐渐兴起。然而,这些方法通常只关注文本信息,忽略了专利之间的关联性和结构信息,导致预测性能有限。
2、知识图谱作为一种表示实体间复杂关系的数据结构,在多个领域得到了广泛应用。知识图谱能够整合多源异构数据,构建实体间的关联网络,为数据挖掘和模式识别提供了丰富的信息。因此,有必要开发一种知识图谱的专利授权预测评估的方法,以满足专利领域的技术分析。
技术实现思路
1、本专利技术克服了现有技术的缺陷,提出了基于属性知识图谱的专利授权预测评估的方法和系统。
2、本专利技术第一方面提供了一种基于属性知识图谱的专利授权预测评估方法,包括:
3、基于专利数据库对每份专利数据进行信息提取,通过nlp语义分析法提取出基于专利id,摘要,关键词、类别的信息,将提取信息基于三元组进行分类形成三元组数据;
4、基于每份专利数据,将每一个独立权要进行基于文本的表征,得到第一权要属性,将非独立权要和关联权要合并成一段文本进行表征,得到第二权要属性;
5、根据三元组数据、第一权要属性与第二权要属性搭
6、获取测试专利文本数据,将所述测试专利文本数据进行三元组分析,形成测试三元组数据,将测试三元组数据导入专利知识图谱进行专利数据检索,并得到检索知识数据;
7、基于检索知识数据进行知识图谱搭建,得到第二知识图谱,在第二知识图谱中,基于amie算法进行知识推荐与图谱完整性搭建;
8、根据测试三元组数据与检索知识数据进行基于实体、属性的相似性分析,得到第一相似度,计算出第二知识图谱的结构性信息,并标记为第一结构性信息,在第二知识图谱中,将测试三元组数据中的实体、属性信息在图谱中进行关联替换,并形成第三知识图谱,计算第三知识图谱中的结构性信息,并标记为第二结构性信息;
9、引入曼哈顿距离,对第一结构性信息与第二结构性信息进行信息差异度计算,得到数据关联度,基于第一相似度与数据关联度对授权性进行预测评价,并得到预测结果信息。
10、本方案中,所述基于专利数据库对每份专利数据进行信息提取,通过nlp语义分析法提取出基于专利id,摘要,关键词、类别的信息,将提取信息基于三元组进行分类形成三元组数据,具体为:
11、从专利数据库中将每份专利数据进行信息提取,得到专利原数据;
12、将专利原数据进行数据清洗、异常值处理分析;
13、基于nlp语义分析法,对专利原数据进行基于专利id,摘要,关键词、专利类别信息进行语义分析与数据提取,将提取数据进行实体命名与关系分析,得到初始专利数据;
14、将初始专利数据进行基于的三元数据分类与关系提取,形成三元组数据。
15、本方案中,所述基于每份专利数据,将每一个独立权要进行基于文本的表征,得到第一权要属性,将非独立权要和关联权要合并成一段文本进行表征,得到第二权要属性,具体为:
16、基于每份专利数据,通过nlp语义分析,获取权利要求的引用关系,根据引用关系,确认独立权要与非独立权要;
17、将独立权要对应的文本数据进行本本表征并形成第一权要属性;
18、将非独立权要和关联权要合并成整合文本数据进行文本表征,形成第二权要属性。
19、本方案中,所述根据三元组数据、第一权要属性与第二权要属性搭建专利知识图谱,并基于预训练模型对专利知识图谱进行训练学习,具体为:
20、根据所述三元组数据、第一权要属性与第二权要属性进行图结构分析与知识图谱数据搭建,形成专利知识图谱;
21、基于bert预训练模型对知识图谱进行实体语义关联分析与知识训练,形成训练后的专利知识图谱。
22、本方案中,所述获取测试专利文本数据,将所述测试专利文本数据进行三元组分析,形成测试三元组数据,将测试三元组数据导入专利知识图谱进行专利数据检索,并得到检索知识数据,具体为:
23、获取测试专利数据,将测试专利数据转化为专利文本数据;
24、基于nlp语义分析将所述测试专利文本数据进行三元组提取,形成测试三元组数据;
25、将测试三元组导入专利知识图谱,基于图结构进行知识检索,并形成检索知识数据。
26、本方案中,所述基于检索知识数据进行知识图谱搭建,得到第二知识图谱,在第二知识图谱中,基于amie算法进行知识推荐与图谱完整性搭建,具体为:
27、基于检索知识数据进行知识图谱搭建,得到第二知识图谱;
28、基于amie算法对第二知识图谱进行关联规则挖掘、知识图谱推理与知识数据补充,形成完整性的第二知识图谱。
29、本方案中,所述根据测试三元组数据与检索知识数据进行基于实体、属性的相似性分析,得到第一相似度,计算出第二知识图谱的结构性信息,并标记为第一结构性信息,在第二知识图谱中,将测试三元组数据中的实体、属性信息在图谱中进行关联替换,并形成第三知识图谱,计算第三知识图谱中的结构性信息,并标记为第二结构性信息,具体为:
30、在检索知识数据中,基于nlp语义分析进行三元组数据提取,得到检索三元组数据;
31、根据标准欧氏距离,计算检索三元组数据与测试三元组数据的数据相似度,并将计算结果标记为第一相似度;
32、在第二知识图谱进行基于实体、属性数据的统计,得到实体与属性统计数据,将第二知识图谱中的关系数据进行基于图结构的边信息统计,得到关系信息数据;
33、将实体与属性统计数据、关系信息数据进行数据整合形成第一结构性信息;
34、在第二知识图谱中,将测试三元组数据中的实体、属性信息在图谱中进行关联替换,并形成第三知识图谱;
35、分析计算第三知识图谱中的结构性信息,并标记为第二结构性信息。
36、本方案中,所述引入曼哈顿距离,对第一结构性信息与第二结构性信息进行信息差异度计算,得到数据关联度,基于第一相似度与数据关联度对授权性进行预测评价,并得到预测结果信息,具体为:
37、根据曼哈顿距离法,将第一结构性信息与第二结构性信息分别进行多维数据的向量化,得到第一向量数据与第二向量数据,对第一向量数据与第二向量数据的进行数据距离计算,得到距离值;
38、以距离值的倒数作为数据关联度;
39、通过第一相似度与数据关联度进行授权预测评价,并形成预测结果信息。
40、本专利技术第二方面还提供了一种基于属性知识本文档来自技高网...
【技术保护点】
1.一种基于属性知识图谱的专利授权预测评估方法,其特征在于,包括:
2.根据权利要求1所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述基于专利数据库对每份专利数据进行信息提取,通过NLP语义分析法提取出基于专利ID,摘要,关键词、类别的信息,将提取信息基于三元组进行分类形成三元组数据,具体为:
3.根据权利要求2所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述基于每份专利数据,将每一个独立权要进行基于文本的表征,得到第一权要属性,将非独立权要和关联权要合并成一段文本进行表征,得到第二权要属性,具体为:
4.根据权利要求3所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述根据三元组数据、第一权要属性与第二权要属性搭建专利知识图谱,并基于预训练模型对专利知识图谱进行训练学习,具体为:
5.根据权利要求4所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述获取测试专利文本数据,将所述测试专利文本数据进行三元组分析,形成测试三元组数据,将测试三元组数据导入专利知识图谱进行专利
6.根据权利要求5所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述基于检索知识数据进行知识图谱搭建,得到第二知识图谱,在第二知识图谱中,基于AMIE算法进行知识推荐与图谱完整性搭建,具体为:
7.根据权利要求6所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述根据测试三元组数据与检索知识数据进行基于实体、属性的相似性分析,得到第一相似度,计算出第二知识图谱的结构性信息,并标记为第一结构性信息,在第二知识图谱中,将测试三元组数据中的实体、属性信息在图谱中进行关联替换,并形成第三知识图谱,计算第三知识图谱中的结构性信息,并标记为第二结构性信息,具体为:
8.根据权利要求7所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述引入曼哈顿距离,对第一结构性信息与第二结构性信息进行信息差异度计算,得到数据关联度,基于第一相似度与数据关联度对授权性进行预测评价,并得到预测结果信息,具体为:
9.一种基于属性知识图谱的专利授权预测评估系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括基于属性知识图谱的专利授权预测评估程序,所述基于属性知识图谱的专利授权预测评估程序被所述处理器执行时实现如下步骤:
...【技术特征摘要】
1.一种基于属性知识图谱的专利授权预测评估方法,其特征在于,包括:
2.根据权利要求1所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述基于专利数据库对每份专利数据进行信息提取,通过nlp语义分析法提取出基于专利id,摘要,关键词、类别的信息,将提取信息基于三元组进行分类形成三元组数据,具体为:
3.根据权利要求2所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述基于每份专利数据,将每一个独立权要进行基于文本的表征,得到第一权要属性,将非独立权要和关联权要合并成一段文本进行表征,得到第二权要属性,具体为:
4.根据权利要求3所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述根据三元组数据、第一权要属性与第二权要属性搭建专利知识图谱,并基于预训练模型对专利知识图谱进行训练学习,具体为:
5.根据权利要求4所述的一种基于属性知识图谱的专利授权预测评估方法,其特征在于,所述获取测试专利文本数据,将所述测试专利文本数据进行三元组分析,形成测试三元组数据,将测试三元组数据导入专利知识图谱进行专利数据检索,并得到检索知识数据,具体为:
6.根据权利要求5所述...
【专利技术属性】
技术研发人员:赖培源,廖德章,廖晓东,闫永骅,李奎,叶世兵,周海涛,蔡焕涛,李岱素,刘士雨,黄俊铮,
申请(专利权)人:广东省华南技术转移中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。