一种专利管理数据处理系统、装置及方法制造方法及图纸

技术编号:37483069 阅读:14 留言:0更新日期:2023-05-07 09:22
本发明专利技术涉及数据处理技术领域,尤其为一种专利管理数据处理系统、装置及方法,包括:专利数据接收层:用于接收专利数据;专利数据预处理层:用于对专利数据进行预处理;专利数据处理层:用于对专利数据进行处理;专利数据存储层:用于通过专利数据库存储专利数据:专利数据管理层:用于对存储的专利数据进行综合管理。本发明专利技术通过获取专利数据的深层特征,通过基于马氏距离进行分类的K近邻算法对专利数据进行自动集成分类,再存储至专利数据库中,并能够对各项专利数据进行综合管理,使用功能简单快捷,同时能够根据使用者制定的专利数据格式规范进行不同方式的存储,降低企业知识产权管理工作的管理成本,提高企业知识产权管理工作的工作效率。作的工作效率。作的工作效率。

【技术实现步骤摘要】
一种专利管理数据处理系统、装置及方法


[0001]本专利技术涉及数据处理
,尤其是一种专利管理数据处理系统、装置及方法。

技术介绍

[0002]现代企业竞争日益激烈,竞争的手段是多种多样,其中知识产权的竞争是其中一个重要方面。目前,大多数企业都会申请知识产权对其自身的创新成果进行保护,对于科技创新型企业而言,其知识产权的保护形式主要是专利保护,对专利信息进行管理,是科技创新型企业管理工作的重要部分。而企业专利信息管理,主要是基于企业专利信息进行管理,专利信息不仅信息量大,而且还有一些期限信息,例如申请过程中的法定期限信息,又例如申请授权后的一些法定期限信息,需要借助一些智能化产品辅助管理工作。
[0003]企业通常使用电子表格等软件人工记录专利信息。但是这种管理方式过分依赖人工,具有各种不确定的因素,容易产生数据篡改、丢失、记录错误等情况。目前市场上有一些管理软件产品,但其功能复杂,不利于企业的管理,因此,亟待提出一种简易使用的专利信息智能化管理方案来克服这一缺陷,降低企业知识产权管理工作的管理成本,提高企业知识产权管理工作的工作效率。

技术实现思路

[0004]本专利技术的目的是通过提出一种专利管理数据处理系统、装置及方法,以解决上述
技术介绍
中提出的缺陷。
[0005]本专利技术采用的技术方案如下:
[0006]提供一种专利管理数据处理系统,包括:
[0007]专利数据接收层:用于接收专利数据;
[0008]专利数据预处理层:用于对专利数据进行预处理;<br/>[0009]专利数据处理层:用于对专利数据进行处理;
[0010]专利数据存储层:用于通过专利数据库存储专利数据:
[0011]专利数据管理层:用于对存储的专利数据进行综合管理。
[0012]作为本专利技术的一种优选技术方案:所述专利数据预处理层的预处理操作包括对专利数据内容、格式的核查与记录。
[0013]作为本专利技术的一种优选技术方案:所述专利数据预处理层的预处理操作还包括专利数据的缺失值处理、专利数据的离散化处理、专利数据的标准化和专利数据的归一化处理。
[0014]作为本专利技术的一种优选技术方案:所述专利数据处理层对于预处理后的专利数据进行分类集成。
[0015]作为本专利技术的一种优选技术方案:所述专利数据处理层获取专利数据序列W=(w(1),w(2),

,w(L)),w(l)表示该专利数据序列中的第l个专利数据,给定局部滑动窗口大小q,表示通过w(l)预测在序列W中w(l)的前面q个词和后面q个词:w(l

q),

,w(l

1),w(l+
1),

,w(l+q)的概率,其中,w(l)为中心专利数据,v(w(l))={w(l

q),

,w(l

1),w(l+1),

,w(l+q)}被称为w(l)的背景专利数据集,构建跳字模型:
[0016][0017]其中,R为跳字模型目标函数,θ是网络学习参数,l=[1,L]为专利数据序列个数,p(v(w(l))|w(l),θ)表示专利数据为背景专利数据的概率;
[0018]又由于背景词的生成是相互独立的,跳字模型目标函数R改写为:
[0019][0020]其中,p(w(l+k)|w(l),θ)表示专利数据为背景专利数据的概率,上式的极大似然估计等于损失函数:
[0021][0022]其中,H为损失函数;
[0023]基于专利数据的训练,得到专利数据的词嵌入矩阵E,E是一个|V|
×
c的矩阵,|V|是词汇表大小,c是词嵌入空间的维度;构建平均词嵌入表示模型:
[0024]A
E
=(W
B

B)E
[0025]其中,A
E
为专利数据的平均词嵌入表示矩阵,矩阵大小为t
×
c,t是专利数据中的文档数量;

表示矩阵的Hadamard积,B是专利数据的布尔表示矩阵,矩阵大小为t
×
|V|,矩阵元素为B
rs
=1表示单词s出现在文本r中,B
rs
=0表示文本r不包含单词s,W
B
为平均词向量的权重:
[0026][0027]其中,w1w2…
w
t
分别为文档内专利数据的平均词向量权重,分别为文档内专利数据的平均词向量权重,是一个|V|维的全1列向量;
[0028]平均词向量加权将文档中的每一个专利数据视为权重相等,将这些专利数据的专利数据嵌入表示进行平均化,作为该文档的向量化表示。
[0029]作为本专利技术的一种优选技术方案:所述专利数据处理层中,根据专利数据的向量化表示,获取专利数据的马氏距离,通过马氏距离划定衡量标准,再通过K近邻算法对专利数据进行分类。
[0030]作为本专利技术的一种优选技术方案:所述专利数据的马氏距离算法如下:
[0031]令X是一个a
×
b的专利数据样本矩阵,包含a个专利数据样本x
i
,i=1,2,

,a,b为
每个专利数据样本的特征数量,得到:
[0032]d2(x
i
,X)=(x
i

μ)Σ
‑1(x
i

μ)
T
[0033]其中,d2(x
i
,X)表示专利数据样本x
i
到总体X的马氏距离的平方,μ是专利数据样本矩阵的均值向量,矩阵的均值向量,表示一个m维的全1列向量的转置,Σ是专利数据样本矩阵的协方差矩阵,阵的协方差矩阵,表示一个m维的全1列向量,Σ是一个实对称半正定矩阵,则存在一个正交矩阵P=[e1,e2,

,e
n
],使得:
[0034]Σ=PΛP
T
[0035]其中P=[e1,e2,

,e
n
],满足i≠u,i,u=1,2,

,n,Λ是一个对角矩阵,对角线上的元素α
i
是Σ的特征值,且α1≥α2≥

≥α
n
≥0,得到:
[0036]d2(x
i
,X)=(x
i

μ)PΛ
‑1P
T
(x
i

μ)
T
[0037]选择前d个大于0的特征值,相应的正交矩阵P

=[e1,e2,

,e
d
],令z
i
=(x
i

μ)P,则:
[0038][00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种专利管理数据处理系统,其特征在于:包括:专利数据接收层(100):用于接收专利数据;专利数据预处理层(200):用于对专利数据进行预处理;专利数据处理层(300):用于对专利数据进行处理;专利数据存储层(400):用于通过专利数据库存储专利数据:专利数据管理层(500):用于对存储的专利数据进行综合管理。2.根据权利要求1所述的专利管理数据处理系统,其特征在于:所述专利数据预处理层(200)的预处理操作包括对专利数据内容、格式的核查与记录。3.根据权利要求2所述的专利管理数据处理系统,其特征在于:所述专利数据预处理层(200)的预处理操作还包括专利数据的缺失值处理、专利数据的离散化处理、专利数据的标准化和专利数据的归一化处理。4.根据权利要求1所述的专利管理数据处理系统,其特征在于:所述专利数据处理层(300)对于预处理后的专利数据进行分类集成。5.根据权利要求4所述的专利管理数据处理系统,其特征在于:所述专利数据处理层(300)获取专利数据序列W=(w(1),w(2),

,w(L)),w(l)表示该专利数据序列中的第l个专利数据,给定局部滑动窗口大小q,表示通过w(l)预测在序列W中w(l)的前面q个词和后面q个词:w(l

q),

,w(l

1),w(l+1),

,w(l+q)的概率,其中,w(l)为中心专利数据,v(w(l))={w(l

q),

,w(l

1),w(l+1),

,w(l+q)}被称为w(l)的背景专利数据集,构建跳字模型:其中,R为跳字模型目标函数,θ是网络学习参数,l=[1,L]为专利数据序列个数,p(v(w(l))|w(l),θ)表示专利数据为背景专利数据的概率;又由于背景词的生成是相互独立的,跳字模型目标函数R改写为:其中,p(w(l+k)|w(l),θ)表示专利数据为背景专利数据的概率,上式的极大似然估计等于损失函数:其中,H为损失函数;基于专利数据的训练,得到专利数据的词嵌入矩阵E,E是一个|V|
×
c的矩阵,|V|是词汇表大小,c是词嵌入空间的维度;构建平均词嵌入表示模型:A
E
=(W
B

B)E其中,A
E
为专利数据的平均词嵌入表示矩阵,矩阵大小为t
×
c,t是专利数据中的文档数量;

表示矩阵的Hadamard积,B是专利数据的布尔表示矩阵,矩阵大小为t
×
|V|,矩阵元素为B
rs
=1表示单词s出现在文本r中,B
rs
=0表示文本r不包含单词s,W
B
为平均词向量的权重:
其中,w1w2…
w
t
分别为文档内专利数据的平均词向量权重,分别为文档内专利数据的平均词向量权重,是一个|V|维的全1列向量;平均词向量加权将文档中的每一个专利数据视为权重相...

【专利技术属性】
技术研发人员:张万伟
申请(专利权)人:青岛中投创新技术转移有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1