一种基于技术特征知识图谱的关联专利推荐方法技术

技术编号:35144599 阅读:21 留言:0更新日期:2022-10-05 10:21
本发明专利技术公开了一种基于技术特征知识图谱的关联专利推荐方法,该方法包括以下步骤:步骤1:构建由元信息关联图谱和技术实体关联图谱组成的技术特征知识图谱,元信息关联图谱建模专利元数据之间的隐式技术关联;技术实体关联图谱建模专利文本内容描述的显式技术关联;步骤2:基于元信息关联图谱训练专利元数据的隐式技术关联空间,生成基于隐式空间相近的候选关联专利;技术实体关联图谱中实体和技术的相关性蕴含显式技术关联,用于从候选关联专利中确定推荐专利。本发明专利技术通过隐式技术关联提升专利推荐的覆盖性,显式技术关联保证专利推荐的准确性,从而实现高质量的关联专利推荐。从而实现高质量的关联专利推荐。从而实现高质量的关联专利推荐。

【技术实现步骤摘要】
一种基于技术特征知识图谱的关联专利推荐方法


[0001]本专利技术属于数据挖掘
,具体涉及一种基于技术特征知识图谱的关联专利推荐方法。

技术介绍

[0002]技术关联性量化方法决定关联专利推荐效果。传统的技术关联性量化方法主要采用两种方式向专利技术使用者推荐关联专利。第一种是以专利标题、摘要、文本描述和权利要求等显式技术关联信息为基础量化技术关联性,向技术使用者推荐重复词汇高的专利,方法直观、准确性高,但是,召回专利覆盖性低,忽视了大量错位互补的隐式技术关联专利。第二种则是以专利申请人、专利技术人和分类等隐式技术关联信息为基础量化技术关联,向技术使用者推荐元信息相近的专利,方法简单,覆盖性高,但是,召回专利准确性低,忽视了专利显式技术关联,没有捕获专利元数据之间复杂的隐式技术关联。

技术实现思路

[0003]本专利技术针对上述的不足之处提供一种方法简单,覆盖性高,准确性高的基于技术特征知识图谱的关联专利推荐方法。
[0004]本专利技术目的是这样实现的:一种基于技术特征知识图谱的关联专利推荐方法,所述该方法包括以下步骤:
[0005]步骤1:构建技术特征知识图谱,专利元数据用于生成元信息关联图谱,专利摘要数据则用于生成技术实体关联图谱;
[0006]步骤2:实施关联专利推荐,通过元信息关联图谱生成候选关联专利列表,基于技术实体关联图谱从候选关联专利列表中确定推荐专利。
[0007]所述技术特征知识图谱由元信息关联图谱和技术实体关联图谱组成。
[0008]优选的,所述步骤1还包括如下步骤:
[0009]步骤1

1:基于专利领域分类、申请人、专利技术人、引用和发布日期等专利元数据构建专利元数据关联陈述,专利领域分类层级关系则用于构建不同分类粒度的专利分类层级间关联陈述;
[0010]步骤1

2:专利摘要依据句法结构分拆为多个子句,而子句依据陈述顺序和线索词标注为专利技术类型、技术特色和应用功效等专利功能性子句,专利功能性子句依据词性标注和模式匹配挖掘技术短语,技术短语和功能性标签关联形成技术实体关联陈述。
[0011]优选的,所述步骤1

1中专利元数据关联陈述包括专利分类关联陈述、专利申请人关联陈述、专利技术人关联陈述、专利引用关联陈述和专利日期关联陈述;
[0012]所述专利分类关联陈述通过分类标签、专利分类号和专利唯一标识符形成;
[0013]所述专利申请人关联陈述通过申请人标签、专利申请人和专利唯一标识符形成;
[0014]所述专利技术人关联陈述通过专利技术人标签、专利专利技术人和专利唯一标识符形成;
[0015]所述专利引用关联陈述通过引用标签、被引专利标识符和专利唯一标识符形成;
[0016]所述专利日期关联陈述通过日期标签、专利发布日期和专利唯一标识符形成。
[0017]优选的,所述专利分类号依据树形分类层级形成专利领域分类层级关系;所述专利分类号依据树形分类层级拆分成不同部件,不同部件之间存在上下位包含关系;
[0018]所述下位分类部件通过上下位标签关联专利上位分类标签,形成下位分类部件、上下位标签和上位分类部件构成的分类粒度关联陈述。
[0019]优选的,所述步骤1

2包括如下步骤:
[0020]步骤1
‑2‑
1:专利摘要依据句号、分号以及问号等单一语义表达中止符进行拆分,形成一组保持摘要表达顺序的子句集合;
[0021]步骤1
‑2‑
2:子句集合的首条语句标注专利技术类型标签,子句集合的所有语句依据线索词标注应用功效标签,子句集合中没有线索词的非首条语句标注技术特色标签;
[0022]步骤1
‑2‑
3:专利功能性子句的每个单词进行词性标注,依据技术短语词性标注匹配模式进行技术短语的识别和挖掘;
[0023]步骤1
‑2‑
4:专利技术类型标签标注的功能性子句中相邻技术短语依据专利技术类型标签关联,形成技术短语1、专利技术类型标签、技术短语2构成的专利技术类型短语关联陈述;
[0024]步骤1
‑2‑
5:技术特色标签标注的功能性子句中相邻技术短语依据技术特色标签关联,形成技术短语1、技术特色标签、技术短语2构成的技术特色短语关联陈述;
[0025]步骤1
‑2‑
6:应用功效标签标注的功能性子句中相邻技术短语依据应用功效标签关联,形成技术短语1、应用功效标签、技术短语2构成的应用功效短语关联陈述。
[0026]优选的,所述步骤2包括如下步骤:
[0027]步骤2

1:基于专利元信息关联图谱训练元数据隐式技术空间,通过特定的量化方法评估专利节点间的引用关联性,用于生成候选关联专利列表;
[0028]步骤2

2:基于专利技术实体关联图谱中节点相似性和节点连通性量化摘要的技术相关性,用于从候选关联专利列表中确定推荐专利。
[0029]优选的,所述步骤2

1包括如下步骤:
[0030]步骤2
‑1‑
1:基于专利元信息关联图谱中专利节点与其他类型节点之间的关联、专利分类下位节点与专利分类上位节点之间的关联训练节点和标签在隐式空间中的向量化表示。
[0031]步骤2
‑1‑
2:通过专利节点和引用标签的向量化表示评估出候选关联专利节点的向量化表示,与该专利候选关联专利节点的向量化表示相近的TOPK个专利节点组成候选关联专利列表。
[0032]优选的,所述步骤2

2包括如下步骤:
[0033]步骤2
‑2‑
1:g1和g2分别对应查询专利和候选关联专利摘要的专利技术实体关联子图,获取子图g1和g2中节点构成实体集合E1和E2;
[0034]步骤2
‑2‑
2:E1中的每一个实体e1在E2中找出语义相似度最高的实体e2,形成E1和E2的实体对齐方案,而实体语义相似性评估方法见步骤2
‑2‑
3;
[0035]步骤2
‑2‑
3:实体e1和e2分解成两个词汇集合,一个集合中的每一个词汇都在另一个集合中找到隐式空间中位置最近的词汇,两个集合中配对词汇的语义相似性的均值作为两个实体的语义相似性;
[0036]步骤2
‑2‑
4:E1和E2的实体对齐方案中语义相似度较高的一半实体对组成对齐方案
子集S
sub
,其中,e∈E
1 and e∈S
sub
的实体形成e∈E
2 ande∈S
sub
的实体形成S
sub
中实体相似性累积之和为sum;
[0037]步骤2
‑2‑
5:子图g1中两个实体全部不属于中的三元组形成T
o1
集合,子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于技术特征知识图谱的关联专利推荐方法,其特征在于:所述该方法包括以下步骤:步骤1:构建技术特征知识图谱,专利元数据用于生成元信息关联图谱,专利摘要数据则用于生成技术实体关联图谱;步骤2:实施关联专利推荐,通过元信息关联图谱生成候选关联专利列表,基于技术实体关联图谱从候选关联专利列表中确定推荐专利。2.根据权利要求1所述的关联专利推荐方法,其特征在于:所述技术特征知识图谱由元信息关联图谱和技术实体关联图谱组成。3.根据权利要求1所述的关联专利推荐方法,其特征在于:所述步骤1包括如下步骤:步骤1

1:基于专利领域分类、申请人、发明人、引用和发布日期的专利元数据构建专利元数据关联陈述,专利领域分类层级关系则用于构建不同分类粒度的专利分类层级间关联陈述;步骤1

2:专利摘要依据句法结构分拆为多个子句,而子句依据陈述顺序和线索词标注为发明类型、技术特色和应用功效的专利功能性子句,专利功能性子句依据词性标注和模式匹配挖掘技术短语,技术短语和功能性标签关联形成技术实体关联陈述。4.根据权利要求3所述的关联专利推荐方法,其特征在于:所述步骤1

1中专利元数据关联陈述包括专利分类关联陈述、专利申请人关联陈述、发明人关联陈述、专利引用关联陈述和专利日期关联陈述;所述专利分类关联陈述通过分类标签、专利分类号和专利唯一标识符形成;所述专利申请人关联陈述通过申请人标签、专利申请人和专利唯一标识符形成;所述发明人关联陈述通过发明人标签、专利发明人和专利唯一标识符形成;所述专利引用关联陈述通过引用标签、被引专利标识符和专利唯一标识符形成;所述专利日期关联陈述通过日期标签、专利发布日期和专利唯一标识符形成。5.根据权利要求4所述的关联专利推荐方法,其特征在于:所述专利分类号依据树形分类层级形成专利领域分类层级关系;所述专利分类号依据树形分类层级拆分成不同部件,不同部件之间存在上下位包含关系;所述下位分类部件通过上下位标签关联专利上位分类标签,形成下位分类部件、上下位标签和上位分类部件构成的分类粒度关联陈述。6.根据权利要求3所述的关联专利推荐方法,其特征在于:所述步骤1

2包括如下步骤:步骤1
‑2‑
1:专利摘要依据句号、分号以及问号的单一语义表达中止符进行拆分,形成一组保持摘要表达顺序的子句集合;步骤1
‑2‑
2:子句集合的首条语句标注发明类型标签,子句集合的所有语句依据线索词标注应用功效标签,子句集合中没有线索词的非首条语句标注技术特色标签;步骤1
‑2‑
3:专利功能性子句的每个单词进行词性标注,依据技术短语词性标注匹配模式进行技术短语的识别和挖掘;步骤1
‑2‑
4:发明类型标签标注的功能性子句中相邻技术短语依据发明类型标签关联,形成技术短语1、发明类型标签、技术短语2构成的发明类型短语关联陈述;步骤1
‑2‑
5:技术特色标签标注的功能性子句中相邻技术短语依据技术特色标签关联,形成技术短语1、技术特色标签、技术短语2构成的技术特色短语关联陈述;
步骤1
‑2‑
6:应用...

【专利技术属性】
技术研发人员:王飞
申请(专利权)人:江苏科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1