基于元数据的专利文献数据存储方法、装置及存储介质制造方法及图纸

技术编号:39283598 阅读:24 留言:0更新日期:2023-11-07 10:56
本申请提供了一种基于元数据的专利文献数据存储方法、装置及存储介质,涉及元数据技术领域,解决现有方法无法将专利文献数据进行标准化管理的问题。该方法包括:按照专利文献元数据模板提取目标专利文献中的多条数据;基于文档结构,确定提取的每条数据的类别;遍历提取的每条数据,对相同类别的数据进行基于深度学习的语义相似度计算,确定相同类别的数据之间的关系,对相同或者相近的数据进行合并;将合并后的数据导入至按照所述专利文献元数据模板生成的存储表格中。本申请能够通过元数据对专利文献数据进行标准化,便于统一管理应用,使得用户能够充分利用表格中的所有数据,为数据分析提供强有力的支持。为数据分析提供强有力的支持。为数据分析提供强有力的支持。

【技术实现步骤摘要】
基于元数据的专利文献数据存储方法、装置及存储介质


[0001]本专利技术涉及元数据
,尤其是基于元数据的专利文献数据存储技术。

技术介绍

[0002]现代企业竞争日益激烈,竞争的手段是多种多样,其中知识产权的竞争是其中一个重要方面。目前,大多数企业都会对相关或者相近
的专利信息进行管理,企业通常使用电子表格等软件人工记录专利信息,但是由于企业需要管理的专利普遍信息量大,由于人工记录和检索网站的差异,会导致数据千差万别,容易产生数据篡改、丢失、记录错误等情况,并且这种管理方式过分依赖人工,具有各种不确定的因素。目前市场上有一些管理软件产品,但其功能复杂,不利于企业的管理,因此,亟待提出一种简易使用的专利信息智能化管理方案来克服这一缺陷,降低企业知识产权管理工作的管理成本,提高企业知识产权管理工作的工作效率。

技术实现思路

[0003]为了解决上述技术缺陷,本申请实施例提供了一种基于元数据的空间地理数据存储方法、装置、电子设备及存储介质。
[0004]本申请第一方面实施例提供一种基于元数据的专利文献数据存储方法,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于元数据的专利文献数据存储方法,其特征在于,包括步骤:按照专利文献元数据模板提取目标专利文献中的多条数据;根据提取的每条数据所处的所述目标专利文献的文档结构,确定提取的每条数据的类别;遍历提取的每条数据,对第一数据和第二数据对应的第一特征向量和第二特征向量进行基于深度学习的余弦相似度计算;将所述余弦相似度计算结果与预设的阈值进行对比,确定所述第一数据和所述第二数据之间的关系,对具有相同或者相近关系的第一数据和第二数据进行合并;所述第一数据和所述第二数据为相同类别的数据,所述第一数据和所述第二数据之间的关系包括相同、相近或者无关;将合并后的数据导入至按照所述专利文献元数据模板生成的存储表格中。2.如权利要求1所述的方法,其特征在于,所述类别包括以下的一项或者多项:名称、设计人、申请人、申请号、申请日、分类号、技术问题信息、设计意图信息、设计论证信息、设计方案信息、优缺点信息。3.如权利要求2所述的方法,其特征在于,根据提取的每条数据所处的所述目标专利文献的文档结构,确定提取的每条数据的类别之后还包括:对无法根据文档结构确定类别的数据进行语义分析,根据语义分析结果确定对应的数据的类别。4.如权利要求1所述的方法,其特征在于,对第一数据和第二数据对应的第一特征向量和第二特征向量进行基于深度学习的余弦相似度计算包括:通过如下表达式对所述第一特征向量V
t1
和所述第二特征向量V
t2
进行余弦相似性计算:Sim(T1, T2) = cos(θ) ==;其中,θ为所述第一特征向量V
t1
和所述第二特征向量V
t2
的夹角,V
t1i
和V
t2i
分别是所述第一特征向量V
t1
和所述第二特征向量V
t2
的第i个组成元素,T1和T2分别是所述第一数据和所述第二数据对应的文本,n为特征向量元素的数量,|| V
t1
||和|| V
t2
||分别是所述第一特征向量V

【专利技术属性】
技术研发人员:孙广芝王淑敏隋媛李岭岭
申请(专利权)人:中国标准化研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1