一种基于区块链和分布式存储的大文本存储、索引及检索方法技术

技术编号:21431973 阅读:44 留言:0更新日期:2019-06-22 11:51
本发明专利技术公开了一种基于区块链和分布式存储的大文本存储、索引及检索方法,其首先将大文本数据存储到分布式存储网络中,分布式存储网络为该大文本数据分配唯一标识doc_id,并且通过doc_id对该大文本的数据进行寻址,然后对大文本行分词和检索处理。本发明专利技术将区块链智能合约技术与分布式存储网络技术结合起来,能够实现在区块链上低成本地进行大文本数据存储,并且快速精准地进行内容检索,使需要大文本数据的DAPP在技术上成为了可能,在成本上降低了门槛。

【技术实现步骤摘要】
一种基于区块链和分布式存储的大文本存储、索引及检索方法
本专利技术属于智能合约与区块链数据存储
,具体涉及一种基于区块链和分布式存储的大文本存储、索引及检索方法。
技术介绍
一般说来,区块链网络由数据层、网络层、共识层、激励层、合约层和应用层组成。其中,数据层封装了底层数据区块以及相关的数据加密和时间戳等技术;网络层则包括分布式组网机制、数据传播机制和数据验证机制等;共识层主要封装网络节点的各类共识算法;激励层将经济因素集成到区块链技术体系中来,主要包括经济激励的发行机制和分配机制等;合约层主要封装各类脚本、算法和智能合约,是区块链可编程特性的基础;应用层则封装了区块链的各种应用场景和案例。基于时间戳的链式区块结构、分布式节点的共识机制、基于共识算力的经济激励和灵活可编程的智能合约是区块链技术最具代表性的创新点。在此基础上,可以将交易数据存储在不可篡改的区块中,并将区块按照时间顺序串连形成区块链,通过非对称加密签名保证交易的安全,通过常见的POW或POS等共识算法,使整个网络达成一致,通过P2P技术实现消息的传输与数据的同步。该技术的优势是具有防篡改、透明及去中心化等特性,可以本文档来自技高网...

【技术保护点】
1.一种基于区块链和分布式存储的大文本存储、索引及检索方法,包括如下步骤:(1)将大文本数据存储到分布式存储网络中,分布式存储网络为大文本数据分配唯一标识doc_id,并且通过doc_id对大文本的数据进行寻址;(2)对大文本数据进行分词处理,生成关键词列表,并基于所有关键词构建关键词倒排索引表keywords_index_table,使每个关键词哈希keyword_hash指向大文本数据的唯一标识doc_id;(3)将索引表keywords_index_table存储到分布式存储网络中,并将其唯一标识keywords_index_table_id和名称keywords_index_table...

【技术特征摘要】
1.一种基于区块链和分布式存储的大文本存储、索引及检索方法,包括如下步骤:(1)将大文本数据存储到分布式存储网络中,分布式存储网络为大文本数据分配唯一标识doc_id,并且通过doc_id对大文本的数据进行寻址;(2)对大文本数据进行分词处理,生成关键词列表,并基于所有关键词构建关键词倒排索引表keywords_index_table,使每个关键词哈希keyword_hash指向大文本数据的唯一标识doc_id;(3)将索引表keywords_index_table存储到分布式存储网络中,并将其唯一标识keywords_index_table_id和名称keywords_index_table_name存储到区块链网络中具体智能合约的数据结构中;(4)在智能合约中建立一种特殊的类型bigtext,通过该类型声明的变量将会被映射为分布式存储网络中的相应索引表keywords_index_table,其变量名称与对应索引表keywords_index_table绑定,且变量名称与变量相关的大文本数据一同被存入分布式存储网络中,并得到一个唯一标识进行寻址,同时大文本数据也会被构建索引到索引表keywords_index_table中。2.根据权利要求1所述的大文本存储、索引及检索方法,其特征在于:所述类型bigtext的变量名称根据索引表keywords_index_table所满足的功能进行制定,且与keywords_index_table_name一致。3.根据权利要求1所述的大文本存储、索引及检索方法,其特征在于:所述智能合约开放有写入接口和检索接口,写入接口用于接受如变量名称及大文本数据的参数,将对应大文本数据存入分布式存储系统并为其构建索引表keywords_index_table;检索接口用于接受参数如变量名称及关键字的参数,并返回符合条件的文档列表。4.根据权利要求3所述的大文本存储、索引及检索方法,其特征在于:所述步骤(2)通过以下两个程序实现:分词程序,用于对大文本数据进行分词处理,生成关键词列表,并将关键词列表传递给索引表构建程序;索引表构建程序,用于对关键词列表进行哈希运算,并基于关键词哈希keyword_hash构建关键词倒排索引表keywords_index_table,使每个关键词哈希key...

【专利技术属性】
技术研发人员:黄步添闫凤喜张维赛徐启源石太彬俞之贝
申请(专利权)人:杭州云象网络技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1