一种数据处理的方法、装置、设备及存储介质制造方法及图纸

技术编号：26730527 阅读：28 留言：0更新日期：2020-12-15 14:31

本发明专利技术公开了一种数据处理的方法、装置、设备及存储介质。一种数据处理方法，包括：接收实时流数据；根据数据去重规则对所述实时流数据进行去重处理，得到去重数据；根据正确性检测规则对所述去重数据进行正确性检测，得到有效数据，并将所述有效数据进行存储。实现了降低数据的存储压力以及保证了数据有效性。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理的方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术，尤其涉及一种数据处理的方法、装置、设备及存储介质。
技术介绍
随着互联网技术的快速发展，互联网中的数据量呈现爆发式指数级别增长模式，数据的处理和存储面临着巨大的考验。互联网时代，存储海量数据需要占用大量的存储空间，然而被占用的存储空间存在着空间无意义占用的现象，同时从海量数据中查找有效数据变得越来越困难，目前的处理方法是通过人工方式对数据进行处理。面对互联网中海量数据，采用人工方式对数据进行过滤以获取有效的数据，需要花费大量时间，处理后的数据中往往混有一些无效的数据。
技术实现思路
本专利技术提供一种数据处理的方法、装置、设备及存储介质，以实现海量数据处理，完成有效数据的提取操作。第一方面，本专利技术实施例提供了一种数据处理方法，包括：接收实时流数据；根据数据去重规则对所述实时流数据进行去重处理，得到去重数据；根据正确性检测规则对所述去重数据进行正确性检测，得到有效数据，并将所述有效数据进行存储。第二方面，本专利技术实施例还提供了一种数据处理装置，该装置包括：数据采集模块，用于接收实时流数据；数据去重模块，用于根据数据去重规则对所述实时流数据进行去重处理，得到去重数据；正确性验证模块，用于根据正确性检测规则对所述去重数据进行正确性检测，得到有效数据；数据存储模块，用于将所述有效数据进行存储。第三方面，本专利技术实施例还提供了一种...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n接收实时流数据；/n根据数据去重规则对所述实时流数据进行去重处理，得到去重数据；/n根据正确性检测规则对所述去重数据进行正确性检测，得到有效数据，并将所述有效数据进行存储。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：
接收实时流数据；
根据数据去重规则对所述实时流数据进行去重处理，得到去重数据；
根据正确性检测规则对所述去重数据进行正确性检测，得到有效数据，并将所述有效数据进行存储。

2.根据权利要求1所述的方法，其特征在于，所述实时流数据包括数据类型标识和至少一个数据属性。

3.根据权利要求2所述的方法，其特征在于，所述根据数据去重规则对所述实时流数据进行去重处理，得到去重数据，包括：
分别将任意两数据的各个数据属性进行比对，当所述任意两数据中各数据属性均相同时，确定所述任意两数据为重复数据，对所述重复数据进行去重处理；
当所述任意两数据中至少一个数据属性不相同时，确定所述任意两数据不是重复数据，保留所述任意两数据。

4.根据权利要求2所述的方法，其特征在于，所述根据数据去重规则对所述实时流数据进行去重处理，得到去重数据，包括：
确定各数据的去重关键属性；
分别将任意两数据的各个数据属性进行比对，当所述任意两数据中各去重关键属性均相同时，确定所述任意两数据为重复数据，对所述重复数据进行去重处理。

5.根据权利要求2所述的方法，其特征在于，根据正确性检测规则对所述去重数据进行正确性检测，得到有效数据，包括：...

【专利技术属性】
技术研发人员：周志刚，万月亮，火一莽，
申请(专利权)人：北京锐安科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人