一种基于制造技术

技术编号:39679059 阅读:10 留言:0更新日期:2023-12-11 18:56
本发明专利技术提出了一种基于

【技术实现步骤摘要】
一种基于NLP实现加密数据存储和检索方法


[0001]本专利技术涉及数据检索及自然语言处理
,具体涉及一种基于
NLP
实现加密数据存储和检索方法


技术介绍

[0002]自然语言处理技术
Natural Language Processing
,简称
NLP
,是人工智能的一个子领域,是研究人与计算机交互的语言问题的一门学科

[0003]随着互联网技术的高速发展,全球信息化已经成为人类发展的大势,然而互联网本身存在着一定的安全隐患,在信息系统建设过程中,系统汇聚的敏感信息越来越多,为了保护私有数据的私密性,人们往往把数据加密后存储在不可信的服务器上,再从加密的数据中检索到符合某些条件的信息,信息的存储

加密

获取往往依赖于网络和云端服务器的交互,因此,如何保障数据存储安全也是建设信息系统的过程中的一个重要问题

[0004]目前,数据加密存储不支持对实体数据进行搜索或者搜索方式按照分词进行,导致数据存储以及搜索目标不够精确,传统的搜索引擎主要是根据关键词进行检索,用户输入的查询语句往往不能表达其真正的需求,搜索有时不能自动为用户提供满意的结果,对此,通过使用
NLP
自然语言处理技术对数据进行加密存储以及检索可以解决上述问题,同时
NLP
自然语言处理技术需要对实体

属性

关系进行精确定义,因此也需要人为的标注过程和专业领域的知识


技术实现思路

[0005]本专利技术针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案

[0006]本专利技术提出了一种基于
NLP
实现加密数据存储方法,包括:
[0007]实体提取
:
即先根据输入的文本数据内容,获取要提取的实体配置列表,其次根据实体配置列表里的实体属性输入实体及其文本数据到
paddlenlp
生成实体数据列表,最后使用
paddlenlp
提取实体文本内容,根据实体文本内容对数据进行聚合得到聚合数据列表;
[0008]数据加密存储
:
即使用加密秘钥
pk
作为
AES
加密密钥对实体文本内容进行加密得到加密文本,使用已经配置好的
RSA
公钥
publickey
对加密密钥
pk
进行加密得到密文密钥,再存储加密文本以及密文密钥到数据库并生成文本主键标识,得到最终的文本数据列表,然后根据实体存储方式遍历实体对实体文本内容进行摘要计算得到摘要数据,并且用摘要数据替换文本数据,得到实体数据列表,把实体数据存储到数据库中

[0009]更进一步地,所述实体配置列表内容包括,实体主键标识

文本主键标识

实体类型和实体内容

[0010]更进一步地,所述聚合数据列表内容包括,实体主键标识

文本主键标识

实体类型

实体内容和实体次数

[0011]更进一步地,所述文本数据列表内容包括,文本主键标识

加密文本内容和密文密钥

[0012]更进一步地,所述实体数据列表内容包括,实体主键标识

文本主键标识

实体类型

实体摘要内容和实体次数

[0013]更进一步地,所述实体提取步骤中,若聚合数据列表中实体内容不为空,则按照实体次数排序进行实体内容拼接

对其进行
MD5
加密得到数据加密密钥
Pk
;进入下一步进行数据加密存储;若实体内容为空,或无敏感信息,则不需要进行加密处理
,
直接明文存储文本数据或使加密密钥为空,结束流程

[0014]本专利技术还提出一种基于
NLP
实现加密数据检索方法,利用上述之任一项所述方法生成的数据列表进行数据检索,其特征在于,包括
:
[0015]数据查询:根据输入的查询数据文本,获取要提取的实体配置列表,并根据实体配置列表对查询数据文本使用
paddlenlp
提取实体进行实体查询,得到实体类型以及实体内容,再根据实体类型对实体文本进行去重摘要计算,得到查询摘要列表,将查询摘要列表作为查询条件精确搜索实体内容,并使用实体次数进行倒序,得到数据文本标识列表,接下来根据文本标识查询得到文本数据列表,最后遍历文本数据列表使用
RSA
私钥对密文密钥进行解密得到加密密钥
pk
,使用加密密钥
pk
作为
AES
解密密钥,解密加密文本,得到解密文本列表并返回给应用

[0016]更进一步地,所述查询摘要列表内容包括实体类型

实体内容和
MD5
加密后的实体内容

[0017]更进一步地,所述数据文本表示列表内容包括,文本主键标识和实体次数

[0018]更进一步地,所述解密文本列表内容包括,文本主键标识

解密文本和加密密钥
Pk。
[0019]本专利技术的技术效果在于:
NLP
自然语言处理技术支持对实体进行数据检索,
NLP
技术能通过对语义

文本

情感

主题的全面分析,自动从用户输入的语句提取关键词

关键短语,以及实体

属性

关系信息,对其进行分类和权重划分,更准确地反应用户需求,不仅能提高搜索结果准确性,还可以自动化处理大量数据,同时,
NLP
的文本生成技术会自动为用户生成完整有意义的文本,提取出查询所需的信息,提高搜索的交互性与可用性

附图说明
[0020]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征

目的和优点将会变得更明显

[0021]图1是根据本专利技术实施例提供的一种基于
NLP
实现加密数据存储和检索方法的整体流程图

[0022]图2是根据本专利技术实施例提供的一种基于
NLP
实现加密数据存储和检索方法涉及到的生成数据列表图

[0023]图3是根据本专利技术实施例提供的一种基于
NLP
实现加密数据存储方法的流程图

[0024]图4是根据本专利技术实施例提供的一种基于
NLP
实现加密数据检索方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于
NLP
实现加密数据存储方法,其特征在于,包括:实体提取
:
即先根据输入的文本数据内容,获取要提取的实体配置列表,其次根据实体配置列表里的实体属性输入实体及其文本数据到
paddlenlp
生成实体数据列表,最后使用
paddlenlp
提取实体文本内容,根据实体文本内容对数据进行聚合得到聚合数据列表;数据加密存储
:
即使用加密秘钥
pk
作为
AES
加密密钥对实体文本内容进行加密得到加密文本,使用已经配置好的
RSA
公钥
publ ickey
对加密密钥
pk
进行加密得到密文密钥,再存储加密文本以及密文密钥到数据库并生成文本主键标识,得到最终的文本数据列表,然后根据实体存储方式遍历实体对实体文本内容进行摘要计算得到摘要数据,并且用摘要数据替换文本数据,得到实体数据列表,把实体数据存储到数据库中
。2.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述实体配置列表内容包括,实体主键标识

文本主键标识

实体类型和实体内容
。3.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述聚合数据列表内容包括,实体主键标识

文本主键标识

实体类型

实体内容和实体次数
。4.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述文本数据列表内容包括,文本主键标识

加密文本内容和密文密钥
。5.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述实体数据列表内容包括,实体主键标识

文本主键标识

实体类型

实体摘要内...

【专利技术属性】
技术研发人员:陈生坚卢天发李仁杰
申请(专利权)人:罗普特厦门系统集成有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1