【技术实现步骤摘要】
一种基于可信账本数据库的数据存储方法、装置及系统
本说明书实施例涉及数据存储领域,尤其涉及一种基于可信账本数据库的数据存储方法、装置及系统。
技术介绍
大数据分析主要用于根据客户的需求针对海量数据进行分析。而在大数据分析的过程中,可能存在客户数据不准确、以及数据处理出错等问题。例如,客户数据缺失或冗余、客户数据存在错误数据、或者数据的分析过程被错误执行等等。出现这些问题的原因可能是客户出错,也可能是大数据分析的服务商出错,也可能是数据传输过程中出错等等。但由于大数据分析是中心化的,客户与大数据分析服务商之间难以在技术层面互相信任,从而难以在出现上述问题时确定责任方。
技术实现思路
为了解决上述技术问题,本说明书提供了一种基于可信账本数据库的数据存储方法、装置及系统。技术方案如下所示。一种基于可信账本数据库的数据存储方法,包括:大数据客户端将目标数据集发送到大数据服务端,并将包含对应于所述目标数据集的哈希值集合的数据记录发送到可信存储端;在指定情况下,大数据服务端针对所述目标数据集进行预处理,将预处理后的所述目标数据集作为待分析数据集,并将相应的预处理过程记录发送到所述可信存储端;所述预处理包括:依次执行数据抽取、数据清洗与数据转换;大数据服务端针对所述待分析数据集执行大数据分析,并将相应的分析过程记录发送到所述可信存储端;其中,所述可信存储端维护有可信账本数据库;所述可信存储端根据接收到各记录的先后顺序,依次将每个记录写入所述可信账本数据库; ...
【技术保护点】
1.一种基于可信账本数据库的数据存储方法,包括:/n大数据客户端将目标数据集发送到大数据服务端,并将包含对应于所述目标数据集的哈希值集合的数据记录发送到可信存储端;/n在指定情况下,大数据服务端针对所述目标数据集进行预处理,将预处理后的所述目标数据集作为待分析数据集,并将相应的预处理过程记录发送到所述可信存储端;所述预处理包括:依次执行数据抽取、数据清洗与数据转换;/n大数据服务端针对所述待分析数据集执行大数据分析,并将相应的分析过程记录发送到所述可信存储端;/n其中,所述可信存储端维护有可信账本数据库;所述可信存储端根据接收到各记录的先后顺序,依次将每个记录写入所述可信账本数据库;所述可信存储端在预设时间计划指定的每个时间点,将该时间点对应的全局哈希提供给所述大数据客户端;所述全局哈希,是在该时间点,基于所述账本数据库中全部记录构建的默克尔树的根哈希。/n
【技术特征摘要】
1.一种基于可信账本数据库的数据存储方法,包括:
大数据客户端将目标数据集发送到大数据服务端,并将包含对应于所述目标数据集的哈希值集合的数据记录发送到可信存储端;
在指定情况下,大数据服务端针对所述目标数据集进行预处理,将预处理后的所述目标数据集作为待分析数据集,并将相应的预处理过程记录发送到所述可信存储端;所述预处理包括:依次执行数据抽取、数据清洗与数据转换;
大数据服务端针对所述待分析数据集执行大数据分析,并将相应的分析过程记录发送到所述可信存储端;
其中,所述可信存储端维护有可信账本数据库;所述可信存储端根据接收到各记录的先后顺序,依次将每个记录写入所述可信账本数据库;所述可信存储端在预设时间计划指定的每个时间点,将该时间点对应的全局哈希提供给所述大数据客户端;所述全局哈希,是在该时间点,基于所述账本数据库中全部记录构建的默克尔树的根哈希。
2.根据权利要求1所述的方法,在进行预处理之前,还包括:
大数据服务端获取写入所述可信存储端的所述数据记录,检验所述数据记录中包含的哈希值集合是否与接收到的目标数据集匹配;
所述指定情况包括:所述数据记录中包含的哈希值集合与接收到的目标数据集匹配。
3.根据权利要求1所述的方法,在进行预处理之前,还包括:
大数据客户端将针对所述目标数据集的数字签名发送到大数据服务端;
大数据服务端根据接收到的数字签名核验接收到的目标数据集是否被修改;
所述指定情况包括:所述目标数据集没有被修改。
4.根据权利要求1所述的方法,所述哈希值集合的获取方法包括:
以所述目标数据集中的全部数据为计算对象,执行一次哈希操作,得到一个哈希值;
或者
针对所述目标数据集中的每条数据,以该条数据为计算对象,执行一次哈希操作,得到对应于该条数据的哈希值。
5.根据权利要求1所述的方法,所述预处理过程记录包括:
所述预处理过程中执行的每个操作信息;
或者
所述预处理过程中执行的每个操作信息、以及对应于每个操作信息的中间操作结果。
6.根据权利要求1所述的方法,所述分析过程记录包括:
所述大数据分析过程中执行的每个操作信息;
或者
所述大数据分析过程中执行的每个操作信息、以及对应于每个操作信息的中间操作结果。
7.根据权利要求1所述的方法,还包括:
大数据服务端将所述大数据分析的分析结果发送到所述可信存储端;
所述可信存储端将所述分析结果写入所述可信账本数据库。
8.根据权利要求1所述的方法,所述可信账本为块链式账本。
9.一种基于权利要求1-8任一项所述方法的分析结果核验方法,包括:
大数据客户端获取可信存储端存储的对应于目标数据集的哈希值集合,检验所述哈希值集合是否与大数据客户端存储的目标数据集匹配;
如果匹配,则获取所述可信存储端存储的预处理过程记录,并基于所述预处理过程记录,针对大数据客户端存储的目标数据集执行同样的操作,得到待核验数据集;
获取所述可信存储端存储的分析过程记录,并基于所述分析过程记录,针对所述待核验数据集执行同样的操作,得到待核验分析结果;
大数据客户端检验所述待核验分析结果、与大数据分析的分析结果是否相同。
10.一种基于可信账本数据库的数据存储方法,应用于大数据服务端;所述方法包括:
接收大数据客户端发送的目标数据集;其中,所述大数据客户端...
【专利技术属性】
技术研发人员:孟硕,管亚阳,俞本权,关涛,张良模,
申请(专利权)人:支付宝杭州信息技术有限公司,蚂蚁区块链科技上海有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。