【技术实现步骤摘要】
基于大数据和多维特征的数据溯源方法及大数据云服务器
本申请涉及大数据分析
,尤其涉及基于大数据和多维特征的数据溯源方法及大数据云服务器。
技术介绍
随着科技的发展,大数据时代悄然而至。大数据可以根据移动互联网、物联网、社交网络、数字家庭、电子商务等信息技术不同来源数据的转换,分析和优化,将各种结果交叉反馈到应用中,去改善用户的体验,来创造最大的商业价值,经济价值以及社会价值。合理有效地利用大数据,能够为人们创造更大的竞争力、价值和财富,以实现数据价值的最大化。然而,随着数据业务规模的不断扩大,数据量也呈现激增状态,这会给大数据服务器造成巨大的存储压力,为了改善大数据服务器端的存储压力,需要对业务数据进行压缩存储。在对业务数据进行压缩存储的过程中难免会丢失一些数据,在后续对压缩存储的业务数据进行再使用时,需要对压缩存储的业务数据进行溯源。
技术实现思路
本申请提供基于大数据和多维特征的数据溯源方法及大数据云服务器,以实现对数据进行溯源从而得到完整的原始业务数据。根据本专利技术实施例的第一方面,提供一种基于大数据和多维特征的数据溯源方法,包括:根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列;对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息;对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集;对所述待溯源数据的特征分布信息进行数据交 ...
【技术保护点】
1.一种基于大数据和多维特征的数据溯源方法,其特征在于,包括:/n根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列;/n对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息;/n对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集;/n对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集;/n根据所述缺损数据特征集,对所述多维数据特征队列以及所述相关性数据特征集进行索引值提取,得到包括索引类别的目标索引值;/n按照所述目标索引值及其所述索引类别在预设数据库中查询与所述待溯源数据对应的目标配对数据,并根据所述目标溯源数据对所述待溯源数据进行溯源得到所述待溯源数据对应的原始业务数据。/n
【技术特征摘要】
1.一种基于大数据和多维特征的数据溯源方法,其特征在于,包括:
根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列;
对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息;
对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集;
对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集;
根据所述缺损数据特征集,对所述多维数据特征队列以及所述相关性数据特征集进行索引值提取,得到包括索引类别的目标索引值;
按照所述目标索引值及其所述索引类别在预设数据库中查询与所述待溯源数据对应的目标配对数据,并根据所述目标溯源数据对所述待溯源数据进行溯源得到所述待溯源数据对应的原始业务数据。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别之前,还包括:对所述待溯源数据进行业务数据标签提取,得到所述待溯源数据的业务处理标签;
其中,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列,包括:根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列。
3.根据权利要求2所述的方法,其特征在于,所述根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列,包括:
根据所述预设的数据特征识别模型中的预存标签信息集、以及所述待溯源数据的业务处理标签,确定用于将所述业务处理标签转换为所述预存标签信息集的标签映射路径;
根据所述标签映射路径对所述待溯源数据的业务处理标签进行路径节点分段映射,基于路径节点分段映射后得到的标签描述信息确定与所述待溯源数据对应的多维数据特征队列。
4.根据权利要求1所述的方法,其特征在于,用于数据环境参数聚类的目标聚类模型包括聚类驱动线程和聚类校正线程;
所述对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息,包括:通过所述聚类驱动线程对所述多维数据特征队列进行基于特征维度数量的数据环境参数聚类,得到所述待溯源数据的特征分布信息;
所述对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集;
所述对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于缺损曲线时序变化的聚类集校正,得到对应所述待溯源数据的缺损数据特征集。
5.根据权利要求4所述的方法,其特征在于,所述聚类校正线程包括多个存在递进关系的校正路径;所述通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集,包括:
通过所述多个存在递进关系的校正路径中的第一个校正路径,对所述待溯源数据的特征分布信息进行特征分布区间校正;将所述第一个校正路径的校正输出信息传入到基于所述递进关系所确定出的下一个校正路径,以在所述基于所述递进关系所确定出的下一个校正路径中继续进行特征分布区间校正和校正输出信息输出,直至输出到最后一个校正路径,并将所述最后一个校正路径输出的校正输出信息映射至聚类特征列表,并基于最后一个校正路径输出的校正...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。