【技术实现步骤摘要】
基于数据湖的知识产权管理方法及其系统
[0001]本申请涉及数据湖多模态数据存储
,且更为具体地,涉及一种基于数据湖的知识产权管理方法及其系统。
技术介绍
[0002]多模态数据一般分为结构化数据、半结构化数据和非结构化数据等。为了应对复杂多变的业务需求,以及多模数据统一处理需求,一般会采用数据湖作为底座统一存储多模数据,减少数据分析中的搬迁,实现统一的数据管理。
[0003]知识产权数据湖本身是一个中心化的存储,需要存储结构化、半结构化和非结构化数据。通过内置关系型数据存储引擎、宽表存储引擎、搜索引擎、地理空间存储引擎、图存储引擎、键值存储引擎、事件存储引擎和时序存储引擎8 种独立的存储引擎,支持业界主流的多种存储模型。用户还可以根据业务的需要随时增减不同的存储引擎,做到资源按需分配,解决知识产权数据湖多模态数据存储。但是,在实际的应用过程中发现,其并不能依据业务的需求选择适宜的存储引擎组合,导致资源的利用率大打折扣。
[0004]因此,期望一种优化的基于数据湖的知识产权管理方案。
专利技术内 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据湖的知识产权管理方法,其特征在于,包括:获取业务需求描述;对所述业务需求描述进行分词处理后通过词嵌入层以得到词嵌入向量的序列;将所述词嵌入向量的序列通过基于转换器的上下文编码器以得到第一尺度业务需求语义理解特征向量;将所述词嵌入向量的序列通过RNN神经网络模型以得到第二尺度业务需求语义理解特征向量;融合所述第一尺度业务需求语义理解特征向量和所述第二尺度业务需求语义理解特征向量以得到业务需求语义理解特征向量;对所述业务需求语义理解特征向量进行特征分布约束以得到优化业务需求语义理解特征向量;以及将所述优化业务需求语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示存储引擎组合的标签值。2.根据权利要求1所述的基于数据湖的知识产权管理方法,其特征在于,将所述词嵌入向量的序列通过基于转换器的上下文编码器以得到第一尺度业务需求语义理解特征向量,包括:将所述词嵌入向量的序列输入所述基于转换器的上下文编码器以得到多个上下文业务需求语义特征向量;以及将所述多个上下文业务需求语义特征向量进行级联以得到所述第一尺度业务需求语义理解特征向量。3.根据权利要求2所述的基于数据湖的知识产权管理方法,其特征在于,将所述词嵌入向量的序列输入所述基于转换器的上下文编码器以得到多个上下文业务需求语义特征向量,包括:将所述词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文业务需求语义特征向量。4.根据权利要求3所述的基于数据湖的知识产权管理方法,其特征在于,融合所述第一尺度业务需求语义理解特征向量和所述第二尺度业务需求语义理解特征向量以得到业务需求语义理解特征向量,包括:以如下公式融合所述第一尺度业务需求语义理解特征向量和所述第二尺度业务需求语义理解特征向量以得到业务需求语义理解特征向量;其中,所述公式为:,其中,表示所述第一尺度业务需求语义理解特征向量,表示所述第二尺度业务需求语义理解特征向量,表示级联函数,表示所述业务需求语义理解特征向量。5.根据权利要求4所述的基于数据湖的知识产权管理方法,其特征在于,对所述业务需求语义理解特征向量进行特征分布约束以得到优化业务需求语义理解特征向量,包括:以如下公式对所述业务需求语义理解特征向量进行正定赋范空间的几何约束重参数化以得到所述优化业务需求语义理解特征向量;其中,所述公式为: ,其中是所述业务需求语义理解特征向量,和分别是所述业务需求语义理解
特征向量和所述优化业务需求语义理解特征向量的第个位置的特征值,且是行向量形式,和是所述业务...
【专利技术属性】
技术研发人员:李义开,夏傲福,王婷,于瀚,贾晓丽,韩方森,刘刚,
申请(专利权)人:日照市德衡信息技术有限公司山东知比特数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。