当前位置: 首页 > 专利查询>江南大学专利>正文

一种专利技术演化脉络的提取方法技术

技术编号:34489310 阅读:27 留言:0更新日期:2022-08-10 09:07
本发明专利技术公开了一种专利技术演化脉络的提取方法,涉及文本信息处理技术,该方法基于自然语言处理对每个专利文本进行语义分析,借鉴联想记忆机制将专利文本中的主从权利要求引用关系转变为上下位语义关联关系,同时联合共现关系构造时间维度和空间维度上的词语节点之间的全局联想网络,此外引入TextRank方法计算全局联想网络中的词语节点的节点权重,通过节点权重和边联想强度提取得到的专利技术演化脉络。提取到的专利技术演化脉络可以清晰地指示专利技术的演化发展过程,分析不同时间的技术研究热点,并且为知识推荐提供个性化的服务,提供的信息更丰富且又有价值,对个性化知识推荐具有显著的价值意义。识推荐具有显著的价值意义。识推荐具有显著的价值意义。

【技术实现步骤摘要】
一种专利技术演化脉络的提取方法


[0001]本专利技术涉及文本信息处理
,尤其是一种专利技术演化脉络的提取方法。

技术介绍

[0002]近年来,专利文献数量暴增并且呈现快速增长态势,一方面展现了各界对保护科学技术所有权的重视;另一方面也展现了专利技术的创新与发展速度的加快,
逐渐细化,创新过程日益复杂。通常地,任何一种技术都不会凭空产生或凭空消亡,必然是在已有技术的基础上经过一定的生命周期从产生走向消亡,这样一个技术生命周期的更迭过程展现的正是领域技术演化发展过程。因此,分析基于时间片划分的专利文献集合,可以有效地展示某领域技术的演化脉络。
[0003]技术演化脉络分析可以定义为根据时间的有序发展,描述技术的变化过程,其作为专利文本挖掘的重要内容之一,不仅能够有效体现某时间段内的技术研究热点,为国家和企业技术发展提供决策支持;同时也能够生成时空维度上的技术演化序列对,应用于知识推荐等个性化服务。传统的专利技术演化脉络分析更多的关注不同时间阶段中专利文本数量的变化,是一种基于宏观的研究,虽然可以清晰展示技术所处的生命周期,但是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种专利技术演化脉络的提取方法,其特征在于,所述方法包括:构建专利样本集,所述专利样本集中包括若干专利文本;基于自然语言处理对每个专利文本进行语义分析,构建得到所述专利文本的局部联想网络,所述局部联想网络指示所述专利文本中包括的词语节点之间的语义联想关系以及联想强度;对所有专利文本的局部联想网络按照专利文本的申请日的先后顺序合并得到所有专利文本的全局联想网络,所述全局联想网络指示所述专利样本集中所有专利文本包含的所有语义联想关系及其联想强度,以及同一个词语节点随着时间顺序的继承演化关系;基于词语节点之间在时间维度和空间维度的相互影响、利用时空维度TextRank模型计算得到所述全局联想网络中的各个词语节点的节点权重;基于各个词语节点的节点权重以及每两个词语节点之间的联想强度,确定通过所述全局联想网络指示的语义联想关系和继承演化关系形成的词语节点之间的各条联想演化路径的路径联想强度,并根据路径联想强度确定词语节点之间的最优联想演化路径,由不同词语节点之间的最优联想演化路径提取得到专利技术演化脉络。2.根据权利要求1所述的方法,其特征在于,构建得到所述专利文本的局部联想网络,包括对于所述专利文本:确定所述专利文本中所有存在直接语义联想关系的词语节点对,以及确定所述专利文本中所有通过各自的中介线索词存在间接语义联想关系的词语节点对,所述直接语义联想关系指示由词语节点对中的一个词语节点直接语义联想得到另一个词语节点,所述间接语义联想关系指示由词语节点对中的一个词语节点通过对应的中介线索词间接语义联想得到另一个词语节点;对得到的所有存在直接语义联想关系的词语节点对进行合并去重,并根据词语节点对中两个词语节点的相对位置索引确定所述词语节点对之间的语义联想关系的联想强度,构建得到所述专利文本的局部联想网络,所述局部联想网络中包括若干个互不相同的词语节点,且每个词语节点与至少一个其他词语节点存在语义联想关系,每两个词语节点之间的语义联想关系具有相应的联想强度。3.根据权利要求2所述的方法,其特征在于,对于所述专利文本中任意的词语节点w
mn
和词语节点w
mn'
:当词语节点w
mn
和词语节点w
mn'
位于所述专利文本的同一个段落内的同一个句子中时,确定词语节点w
mn
和词语节点w
mn'
构成一对存在直接语义联想关系的词语节点对,且所述直接语义联想关系指示由相对位置在前的词语节点w
mn
直接语义联想得到相对位置在后的词语节点w
mn'
;和/或,当词语节点w
mn
位于上位段落P
m
内的句子S
mj
中、词语节点w
mn'
位于下位段落P
m'
内的句子S
m'j'
中,所述下位段落P
m'
引用所述上位段落P
m
,且句子S
mj
中和句子S
m'j'
中存在同一个中介线索词w
t
时,确定词语节点w
mn
和词语节点w
mn'
通过中介线索词w
t
构成一对存在间接语义联想关系的词语节点对,且所述间接语义联想关系指示由相对位置在前的词语节点w
mn
通过中介线索词w
t
间接语义联想得到相对位置在后的词语节点w
mn'
,其中中介线索词w
t
与词语节点w
mn
和词语节点w
mn'
不同。4.根据权利要求3所述的方法,其特征在于,由词语节点a语义联想得到词语节点b的语
义联想关系的联想强度为:其中,R
d
(a,b)表示词语节点a和词语节点b之间的直接语义联想关系的强度,R
s
(a,b)表示词语节点a和词语节点b之间的间接语义联想关系的强度;当词语节点a和词语节点b之间仅存在间接语义联想关系时,R
d
(a,b)=0;当词语节点a和词语节点b之间存在至少一组直接语义联想关系时,每组直接语义联想关系的强度R
d
(a,b)=I
a

I
b
,I
a
是所述直接语义联想关系中的词语节点a的相对位置索引,I
b
是所述直接语义联想关系中的词语节点b的相对位置索引;当词语节点a和词语节点b之间仅存在直接语义联想关系时,R
s
(a,b)=0;当词语节点a和词语节点b之间存在至少一组间接语义联想关系时,每组间接语义联想关系的强度和词语节点b之间存在至少一组间接语义联想关系时,每组间接语义联想关系的强度是所述间接语义联想关系中的词语节点a的相对位置索引,是所述间接语义联想关系中的词语节点b的相对位置索引,是与词语节点a位于同一个段落内的同一个句子中的中介线索词c的相对位置索引,是与词语节点b位于同一个段落内的同一个句子中的中介线索词c的相...

【专利技术属性】
技术研发人员:谢振平黄兆欣李玉林朱航宇刘渊詹千熠
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1