一种基于关键词和私有信息的能源大数据查询方法和系统技术方案

技术编号:41458383 阅读:30 留言:0更新日期:2024-05-28 20:44
本发明专利技术涉及一种基于关键词和私有信息的能源大数据查询方法和系统,属于大数据技术领域,解决用关键词直接查询会增加查询负担等问题。方法包括:基于查询文本利用BERT模型生成第一关键词集合并利用私有信息检索PIR技术将第一关键词集合发送给数据拥有者,BERT模型包括基于自注意力机制的深度网络的Transformer结构;根据第一关键词集合在关键词索引数据库中选择精确查询关键词以生成第二关键词集合并返回数据查询者;再次利用私有信息检索PIR技术将第二关键词集合发送到数据拥有者,然后基于第二关键词集合在能源大数据库中进行检索并将加密的私有数据查询结果返回给数据查询者。通过与关键词索引数据库进行查询交互明确查询者的查询需求。

【技术实现步骤摘要】

本专利技术涉及大数据,尤其涉及一种基于关键词和私有信息的能源大数据查询方法和系统


技术介绍

1、能源大数据涵盖煤炭、电力、石油等行业性生产与消费全过程数据,以及气象、环境、交通等公共数据。能源大数据分属于不同的领域,归属于不同的主体,拥有能源大数据的机构或个人由于数据可能会涉及到个人私有信息、商业秘密,数据存在共享阻碍,数据价值难以得到释放。

2、能源大数据产品通常可以分为以下两类:能源大数据查询类产品,主要提供个人数据、行业数据和公共数据的查询服务;能源大数据建模类产品,主要用于数据建模工作。能源大数据查询类产品能够为能源大数据查询提供一种技术方案。能源大数据查询者期望从能源大数据拥有者查询所需要的数据,数据查询者根据查询索引或者查询关键词从数据拥有者的数据库获取所需的数据,但不希望数据拥有者知晓查询索引或查询关键词的信息,且能源大数据拥有者也不想数据查询者获得查询索引或查询关键词所对应查询内容之外的数据信息。

3、私有信息检索(private information retrieval,pir)可以为上述应用提供解决思路。但现本文档来自技高网...

【技术保护点】

1.一种基于关键词和私有信息的能源大数据查询方法,其特征在于,包括:

2.根据权利要求1所述的基于关键词和私有信息的能源大数据查询方法,其特征在于,根据查询文本生成第一关键词集合并利用私有信息检索PIR技术将所述第一关键词集合发送给数据拥有者进一步包括:

3.根据权利要求2所述的基于关键词和私有信息的能源大数据查询方法,其特征在于,利用BERT模型对所述词序列进行查询关键词提取以生成所述第一关键词集合包括:

4.根据权利要求3所述的基于关键词和私有信息的能源大数据查询方法,其特征在于,利用BERT模型对所述词序列进行查询关键词提取以生成所述第一关键词集...

【技术特征摘要】

1.一种基于关键词和私有信息的能源大数据查询方法,其特征在于,包括:

2.根据权利要求1所述的基于关键词和私有信息的能源大数据查询方法,其特征在于,根据查询文本生成第一关键词集合并利用私有信息检索pir技术将所述第一关键词集合发送给数据拥有者进一步包括:

3.根据权利要求2所述的基于关键词和私有信息的能源大数据查询方法,其特征在于,利用bert模型对所述词序列进行查询关键词提取以生成所述第一关键词集合包括:

4.根据权利要求3所述的基于关键词和私有信息的能源大数据查询方法,其特征在于,利用bert模型对所述词序列进行查询关键词提取以生成所述第一关键词集合包括:

5.根据权利要求1所述的基于关键词和私有信息的能源大数据查询方法,其特征在于,根据所述第一关键词集合在关键词索引数据库中选择精确查询...

【专利技术属性】
技术研发人员:王世谦鞠立伟李秋燕齐鑫汪鹏张哲宇王涵王圆圆张欧婷冯元华远鹏卜飞飞宋大为韩丁贾一博
申请(专利权)人:国网河南省电力公司经济技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1