一种大数据自适应采集方法技术

技术编号：39788051 阅读：16 留言：0更新日期：2023-12-22 02:27

本发明专利技术提供一种方法大数据自适应采集方法，使用

全部详细技术资料下载

【技术实现步骤摘要】
一种大数据自适应采集方法

[0001]本专利技术涉及大数据治理与融合
，特别涉及一种大数据自适应采集方法
。

技术介绍

[0002]大数据治理是指以最大限度地发挥数据价值
、
最小化生产风险为目标的数据管理过程
。
数据治理的作用在于保证数据的正规化以及减少数据的冗余；数据治理的核心是计划
、
监测和实施
。
其中，数据治理的规划指的是对管理数据模型的标准化进行定义，用户能够创建满足业务要求的标准模型，并对模型的属性及规则进行配置，从而设计质检规则和数据清洗原则等
。
数据治理的监测指的是对数据信息展开一次预览，并对表的血缘关系和字段的血缘关系进行跟踪，从而对数据在数据治理过程中的整个生命周期进行全面的把握
。
数据治理的实施指的是在对数据清洗
、
数据集中
、
质量稽核的规则和标准进行配置之后，进行的详细的数据治理服务
。
[0003]大数据治理是一个需要持续实施的<br/>、
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种大数据自适应采集方法，其特征在于：使用
Bisquare
算法来构造一元线性回归模型，并利用所述一元线性回归模型来感知数据的变化，并根据所述一元线性回归模型倾斜度动态调节采集的时间间隔，所述动态调节包括下述步骤：
S1、
通过最小二乘法将最近的有限个离散数据点
m2(x2,y2)
，
m1(x1,y1)
…
m
n
(x
n
,y
n
)
进行线性拟合，然后得到拟合模型的初始斜率和截距的估计值
a
i
与
b
i
：：式中，为离散数据点的
y
轴坐标平均值，为离散数据点的
x
轴坐标平均值，
i
为离散数据点的序号，
n
为
y
的长度；
S2、
利用残差最小化的方法得到权重的更新值，残差最小化的计算式为：
f
’
i
＝
a
i
x+b
i
ꢀꢀꢀꢀꢀ
(4)
；式中，
E
为数据点的权重的残差值，
y
i
为序号为
i
的离散数据点的
y
轴坐标值，
w
i
为序号为
i
的数据点的权重，
f
i
为序号为
i
的数据点的最佳拟合值，
f
’
i
为序号为
i
的数据点的导数值，
x
为离散数据点的
x
轴坐标值；
S3、
根据已经得到的
a0和
b0，然后利用残差最小化对式
(4)
中的
a
i
进行求导并使
E
等于零，可得：
S4、
将新获...

【专利技术属性】
技术研发人员：陈雯珊，王辉，杨璐璐，刘晗之，刘凌坤，林健，梁诗瑶，许燕萍，吴明魁，
申请(专利权)人：福建省星云大数据应用服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人