【技术实现步骤摘要】
一种基于NLP实现加密数据存储和检索方法
[0001]本专利技术涉及数据检索及自然语言处理
,具体涉及一种基于
NLP
实现加密数据存储和检索方法
。
技术介绍
[0002]自然语言处理技术
Natural Language Processing
,简称
NLP
,是人工智能的一个子领域,是研究人与计算机交互的语言问题的一门学科
。
[0003]随着互联网技术的高速发展,全球信息化已经成为人类发展的大势,然而互联网本身存在着一定的安全隐患,在信息系统建设过程中,系统汇聚的敏感信息越来越多,为了保护私有数据的私密性,人们往往把数据加密后存储在不可信的服务器上,再从加密的数据中检索到符合某些条件的信息,信息的存储
、
加密
、
获取往往依赖于网络和云端服务器的交互,因此,如何保障数据存储安全也是建设信息系统的过程中的一个重要问题
。
[0004]目前,数据加密存储不支持对实体数据进行搜索或者搜索方式按照分词进行,导致数据存储以及搜索目标不够精确,传统的搜索引擎主要是根据关键词进行检索,用户输入的查询语句往往不能表达其真正的需求,搜索有时不能自动为用户提供满意的结果,对此,通过使用
NLP
自然语言处理技术对数据进行加密存储以及检索可以解决上述问题,同时
NLP
自然语言处理技术需要对实体
、
属性
、
关系进行精确定义,因此也需要人为 ...
【技术保护点】
【技术特征摘要】
1.
一种基于
NLP
实现加密数据存储方法,其特征在于,包括:实体提取
:
即先根据输入的文本数据内容,获取要提取的实体配置列表,其次根据实体配置列表里的实体属性输入实体及其文本数据到
paddlenlp
生成实体数据列表,最后使用
paddlenlp
提取实体文本内容,根据实体文本内容对数据进行聚合得到聚合数据列表;数据加密存储
:
即使用加密秘钥
pk
作为
AES
加密密钥对实体文本内容进行加密得到加密文本,使用已经配置好的
RSA
公钥
publ ickey
对加密密钥
pk
进行加密得到密文密钥,再存储加密文本以及密文密钥到数据库并生成文本主键标识,得到最终的文本数据列表,然后根据实体存储方式遍历实体对实体文本内容进行摘要计算得到摘要数据,并且用摘要数据替换文本数据,得到实体数据列表,把实体数据存储到数据库中
。2.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述实体配置列表内容包括,实体主键标识
、
文本主键标识
、
实体类型和实体内容
。3.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述聚合数据列表内容包括,实体主键标识
、
文本主键标识
、
实体类型
、
实体内容和实体次数
。4.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述文本数据列表内容包括,文本主键标识
、
加密文本内容和密文密钥
。5.
根据权利要求1所述的基于
NLP
实现加密数据存储方法,其特征在于,所述实体数据列表内容包括,实体主键标识
、
文本主键标识
、
实体类型
、
实体摘要内...
【专利技术属性】
技术研发人员:陈生坚,卢天发,李仁杰,
申请(专利权)人:罗普特厦门系统集成有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。