【技术实现步骤摘要】
一种基于技术特征知识图谱的关联专利推荐方法
[0001]本专利技术属于数据挖掘
,具体涉及一种基于技术特征知识图谱的关联专利推荐方法。
技术介绍
[0002]技术关联性量化方法决定关联专利推荐效果。传统的技术关联性量化方法主要采用两种方式向专利技术使用者推荐关联专利。第一种是以专利标题、摘要、文本描述和权利要求等显式技术关联信息为基础量化技术关联性,向技术使用者推荐重复词汇高的专利,方法直观、准确性高,但是,召回专利覆盖性低,忽视了大量错位互补的隐式技术关联专利。第二种则是以专利申请人、专利技术人和分类等隐式技术关联信息为基础量化技术关联,向技术使用者推荐元信息相近的专利,方法简单,覆盖性高,但是,召回专利准确性低,忽视了专利显式技术关联,没有捕获专利元数据之间复杂的隐式技术关联。
技术实现思路
[0003]本专利技术针对上述的不足之处提供一种方法简单,覆盖性高,准确性高的基于技术特征知识图谱的关联专利推荐方法。
[0004]本专利技术目的是这样实现的:一种基于技术特征知识图谱的关联专利推荐方法,所述该方法包括以下步骤:
[0005]步骤1:构建技术特征知识图谱,专利元数据用于生成元信息关联图谱,专利摘要数据则用于生成技术实体关联图谱;
[0006]步骤2:实施关联专利推荐,通过元信息关联图谱生成候选关联专利列表,基于技术实体关联图谱从候选关联专利列表中确定推荐专利。
[0007]所述技术特征知识图谱由元信息关联图谱和技术实体关联图谱组成。
[0008]优 ...
【技术保护点】
【技术特征摘要】
1.一种基于技术特征知识图谱的关联专利推荐方法,其特征在于:所述该方法包括以下步骤:步骤1:构建技术特征知识图谱,专利元数据用于生成元信息关联图谱,专利摘要数据则用于生成技术实体关联图谱;步骤2:实施关联专利推荐,通过元信息关联图谱生成候选关联专利列表,基于技术实体关联图谱从候选关联专利列表中确定推荐专利。2.根据权利要求1所述的关联专利推荐方法,其特征在于:所述技术特征知识图谱由元信息关联图谱和技术实体关联图谱组成。3.根据权利要求1所述的关联专利推荐方法,其特征在于:所述步骤1包括如下步骤:步骤1
‑
1:基于专利领域分类、申请人、发明人、引用和发布日期的专利元数据构建专利元数据关联陈述,专利领域分类层级关系则用于构建不同分类粒度的专利分类层级间关联陈述;步骤1
‑
2:专利摘要依据句法结构分拆为多个子句,而子句依据陈述顺序和线索词标注为发明类型、技术特色和应用功效的专利功能性子句,专利功能性子句依据词性标注和模式匹配挖掘技术短语,技术短语和功能性标签关联形成技术实体关联陈述。4.根据权利要求3所述的关联专利推荐方法,其特征在于:所述步骤1
‑
1中专利元数据关联陈述包括专利分类关联陈述、专利申请人关联陈述、发明人关联陈述、专利引用关联陈述和专利日期关联陈述;所述专利分类关联陈述通过分类标签、专利分类号和专利唯一标识符形成;所述专利申请人关联陈述通过申请人标签、专利申请人和专利唯一标识符形成;所述发明人关联陈述通过发明人标签、专利发明人和专利唯一标识符形成;所述专利引用关联陈述通过引用标签、被引专利标识符和专利唯一标识符形成;所述专利日期关联陈述通过日期标签、专利发布日期和专利唯一标识符形成。5.根据权利要求4所述的关联专利推荐方法,其特征在于:所述专利分类号依据树形分类层级形成专利领域分类层级关系;所述专利分类号依据树形分类层级拆分成不同部件,不同部件之间存在上下位包含关系;所述下位分类部件通过上下位标签关联专利上位分类标签,形成下位分类部件、上下位标签和上位分类部件构成的分类粒度关联陈述。6.根据权利要求3所述的关联专利推荐方法,其特征在于:所述步骤1
‑
2包括如下步骤:步骤1
‑2‑
1:专利摘要依据句号、分号以及问号的单一语义表达中止符进行拆分,形成一组保持摘要表达顺序的子句集合;步骤1
‑2‑
2:子句集合的首条语句标注发明类型标签,子句集合的所有语句依据线索词标注应用功效标签,子句集合中没有线索词的非首条语句标注技术特色标签;步骤1
‑2‑
3:专利功能性子句的每个单词进行词性标注,依据技术短语词性标注匹配模式进行技术短语的识别和挖掘;步骤1
‑2‑
4:发明类型标签标注的功能性子句中相邻技术短语依据发明类型标签关联,形成技术短语1、发明类型标签、技术短语2构成的发明类型短语关联陈述;步骤1
‑2‑
5:技术特色标签标注的功能性子句中相邻技术短语依据技术特色标签关联,形成技术短语1、技术特色标签、技术短语2构成的技术特色短语关联陈述;
步骤1
‑2‑
6:应用...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。