当前位置: 首页 > 专利查询>黄天红专利>正文

基于大数据和多维特征的数据溯源方法及大数据云服务器技术

技术编号:26689756 阅读:18 留言:0更新日期:2020-12-12 02:39
本申请关于的基于大数据和多维特征的数据溯源方法及大数据云服务器,首先对待溯源数据进行多维特征识别得到多维数据特征队列,其次对多维数据特征队列进行数据环境参数聚类得到特征分布信息并分别对特征分布信息进行特征相关性识别和数据交互缺损识别以得到相关性数据特征集和缺损数据特征集,然后根据缺损数据特征集对多维数据特征队列以及相关性数据特征集进行索引值提取得到包括索引类别的目标索引值,最后按照目标索引值及其索引类别在预设数据库中查询与待溯源数据对应的目标配对数据并根据目标溯源数据对待溯源数据进行溯源得到原始业务数据。如此,能够考虑待溯源数据的多维数据特征,实现对待溯源数据的完整、准确的溯源。

【技术实现步骤摘要】
基于大数据和多维特征的数据溯源方法及大数据云服务器
本申请涉及大数据分析
,尤其涉及基于大数据和多维特征的数据溯源方法及大数据云服务器。
技术介绍
随着科技的发展,大数据时代悄然而至。大数据可以根据移动互联网、物联网、社交网络、数字家庭、电子商务等信息技术不同来源数据的转换,分析和优化,将各种结果交叉反馈到应用中,去改善用户的体验,来创造最大的商业价值,经济价值以及社会价值。合理有效地利用大数据,能够为人们创造更大的竞争力、价值和财富,以实现数据价值的最大化。然而,随着数据业务规模的不断扩大,数据量也呈现激增状态,这会给大数据服务器造成巨大的存储压力,为了改善大数据服务器端的存储压力,需要对业务数据进行压缩存储。在对业务数据进行压缩存储的过程中难免会丢失一些数据,在后续对压缩存储的业务数据进行再使用时,需要对压缩存储的业务数据进行溯源。
技术实现思路
本申请提供基于大数据和多维特征的数据溯源方法及大数据云服务器,以实现对数据进行溯源从而得到完整的原始业务数据。根据本专利技术实施例的第一方面,提供一种基于大数据和多维特征的数据溯源方法,包括:根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列;对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息;对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集;对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集;根据所述缺损数据特征集,对所述多维数据特征队列以及所述相关性数据特征集进行索引值提取,得到包括索引类别的目标索引值;按照所述目标索引值及其所述索引类别在预设数据库中查询与所述待溯源数据对应的目标配对数据,并根据所述目标溯源数据对所述待溯源数据进行溯源得到所述待溯源数据对应的原始业务数据。在上述第一方面的基础上,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别之前,还包括:对所述待溯源数据进行业务数据标签提取,得到所述待溯源数据的业务处理标签;其中,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列,包括:根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列。在上述第一方面的基础上,所述根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列,包括:根据所述预设的数据特征识别模型中的预存标签信息集、以及所述待溯源数据的业务处理标签,确定用于将所述业务处理标签转换为所述预存标签信息集的标签映射路径;根据所述标签映射路径对所述待溯源数据的业务处理标签进行路径节点分段映射,基于路径节点分段映射后得到的标签描述信息确定与所述待溯源数据对应的多维数据特征队列。在上述第一方面的基础上,用于数据环境参数聚类的目标聚类模型包括聚类驱动线程和聚类校正线程;所述对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息,包括:通过所述聚类驱动线程对所述多维数据特征队列进行基于特征维度数量的数据环境参数聚类,得到所述待溯源数据的特征分布信息;所述对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集;所述对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于缺损曲线时序变化的聚类集校正,得到对应所述待溯源数据的缺损数据特征集。在上述第一方面的基础上,所述聚类校正线程包括多个存在递进关系的校正路径;所述通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集,包括:通过所述多个存在递进关系的校正路径中的第一个校正路径,对所述待溯源数据的特征分布信息进行特征分布区间校正;将所述第一个校正路径的校正输出信息传入到基于所述递进关系所确定出的下一个校正路径,以在所述基于所述递进关系所确定出的下一个校正路径中继续进行特征分布区间校正和校正输出信息输出,直至输出到最后一个校正路径,并将所述最后一个校正路径输出的校正输出信息映射至聚类特征列表,并基于最后一个校正路径输出的校正输出信息在所述聚类特征列表中的聚类集中度对应的集中度权重队列确定对应所述待溯源数据的相关性数据特征集。在上述第一方面的基础上,所述聚类驱动线程包括多个存在驱动干扰的驱动函数;所述通过所述聚类驱动线程对所述多维数据特征队列进行基于特征维度数量的数据环境参数聚类,得到所述待溯源数据的特征分布信息,包括:通过所述多个存在驱动干扰的驱动函数中的具有最大干扰因子的驱动函数,对所述多维数据特征队列进行环境特征数据提取;将所述具有最大干扰因子的驱动函数的当前环境特征数据提取结果加载至所述多个存在驱动干扰的驱动函数中除最大干扰因子的驱动函数之外的具有第二大干扰因子的驱动函数,以基于所述多个存在驱动干扰的驱动函数中除最大干扰因子的驱动函数之外的具有第二大干扰因子的驱动函数中继续进行环境特征数据提取和当前环境特征数据提取结果的级联加载,直至级联加载到所述多个存在驱动干扰的驱动函数中具有最小干扰因子的驱动函数中;将所述所述多个存在驱动干扰的驱动函数中具有最小干扰因子的驱动函数输出的当前环境特征数据提取结果中具有目标维度数量的环境特征数据作为所述待溯源数据的特征分布信息。在上述第一方面的基础上,当所述聚类校正线程包括多个存在递进关系的校正路径,且相邻的校正路径之间存在共用校正节点时,所述通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集,包括:通过所述多个存在递进关系的校正路径中的第一个校正路径,对所述待溯源数据的特征分布信息进行特征分布区间校正;将校正输出信息与所述第一个校正路径存在共用校正节点的目标校正路径对应的目标驱动函数输出的当前环境特征数据提取结果进行整合,将整合结果作为所述第一个校正路径的校正输出信息,并输出到基于所述递进关系所确定出的下一个校正路径,以在所述基于所述递进关系所确定出的下一个校正路径中继续进行特征分布区间校正、整合处理和校正输出信息输出,直至输出到最后一个校正路径;将所述最后一个校正路径输出的校正输出信息映射至聚类特征列表,并基于最后一个校正路径输出的校正输出信息在所述聚类特征列表中的聚类集中度本文档来自技高网...

【技术保护点】
1.一种基于大数据和多维特征的数据溯源方法,其特征在于,包括:/n根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列;/n对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息;/n对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集;/n对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集;/n根据所述缺损数据特征集,对所述多维数据特征队列以及所述相关性数据特征集进行索引值提取,得到包括索引类别的目标索引值;/n按照所述目标索引值及其所述索引类别在预设数据库中查询与所述待溯源数据对应的目标配对数据,并根据所述目标溯源数据对所述待溯源数据进行溯源得到所述待溯源数据对应的原始业务数据。/n

【技术特征摘要】
1.一种基于大数据和多维特征的数据溯源方法,其特征在于,包括:
根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列;
对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息;
对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集;
对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集;
根据所述缺损数据特征集,对所述多维数据特征队列以及所述相关性数据特征集进行索引值提取,得到包括索引类别的目标索引值;
按照所述目标索引值及其所述索引类别在预设数据库中查询与所述待溯源数据对应的目标配对数据,并根据所述目标溯源数据对所述待溯源数据进行溯源得到所述待溯源数据对应的原始业务数据。


2.根据权利要求1所述的方法,其特征在于,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别之前,还包括:对所述待溯源数据进行业务数据标签提取,得到所述待溯源数据的业务处理标签;
其中,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列,包括:根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列。


3.根据权利要求2所述的方法,其特征在于,所述根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列,包括:
根据所述预设的数据特征识别模型中的预存标签信息集、以及所述待溯源数据的业务处理标签,确定用于将所述业务处理标签转换为所述预存标签信息集的标签映射路径;
根据所述标签映射路径对所述待溯源数据的业务处理标签进行路径节点分段映射,基于路径节点分段映射后得到的标签描述信息确定与所述待溯源数据对应的多维数据特征队列。


4.根据权利要求1所述的方法,其特征在于,用于数据环境参数聚类的目标聚类模型包括聚类驱动线程和聚类校正线程;
所述对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息,包括:通过所述聚类驱动线程对所述多维数据特征队列进行基于特征维度数量的数据环境参数聚类,得到所述待溯源数据的特征分布信息;
所述对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集;
所述对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于缺损曲线时序变化的聚类集校正,得到对应所述待溯源数据的缺损数据特征集。


5.根据权利要求4所述的方法,其特征在于,所述聚类校正线程包括多个存在递进关系的校正路径;所述通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集,包括:
通过所述多个存在递进关系的校正路径中的第一个校正路径,对所述待溯源数据的特征分布信息进行特征分布区间校正;将所述第一个校正路径的校正输出信息传入到基于所述递进关系所确定出的下一个校正路径,以在所述基于所述递进关系所确定出的下一个校正路径中继续进行特征分布区间校正和校正输出信息输出,直至输出到最后一个校正路径,并将所述最后一个校正路径输出的校正输出信息映射至聚类特征列表,并基于最后一个校正路径输出的校正...

【专利技术属性】
技术研发人员:黄天红
申请(专利权)人:黄天红
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1