一种基于流水数据的特征衍生方法及装置制造方法及图纸

技术编号:42006799 阅读:24 留言:0更新日期:2024-07-12 12:27
本发明专利技术涉及特征数据衍生技术领域,具体涉及一种基于流水数据的特征衍生方法及装置,包括:数据预处理模块;特征衍生算法模块;后处理模块;数据预处理模块用于清洗和标准化输入流水数据,数据预处理模块通过清洗和标准化流水数据,为高质量的数据分析奠定了基础。确保了输入数据的准确性和一致性,这是高效数据分析和可靠特征提取的前提。减少了错误或偏差对分析结果的影响,提高了整个数据处理效率和准确性;特征衍生算法模块用于从预处理后的数据中提取关键特征;后处理模块用于对提取的特征进行评估,通过时序分析和聚类分析的结合使用,能够更深入地理解流水数据的动态和结构。

【技术实现步骤摘要】

本专利技术提出了一种基于流水数据的特征衍生方法及装置,涉及特征数据衍生。


技术介绍

1、特征数据衍生是一种数据分析技术,旨在从连续生成的数据(即流水数据)中提取有用的信息或特征。这些特征随后可以用于各种数据驱动的应用,如预测建模、趋势分析、用户行为分析等。流水数据通常指的是随时间连续记录的数据,如交易记录、日志文件、传感器数据等;

2、特征衍生是指从原始数据中创建新的特征或变量的过程。这些新特征可以帮助模型更好地理解数据,提高预测性能。特征衍生通常基于领域知识、业务逻辑或统计方法,旨在捕捉数据中的有用信息。

3、然而现有技术的特征数据衍生具有以下不足:

4、传统上,时序分析和聚类通常是独立使用的,这限制了它们在处理复杂流水数据时的效能。现有技术无法同时考虑时间序列数据的动态特性和数据点之间的相似性,导致不能完全揭示数据中的隐藏模式和关系。

5、在没有将时序分析与聚类相结合的现有技术中,忽略了数据随时间变化的重要特征,这对于理解某些关键的业务趋势和模式至关重要,尤其是在快速变化的市场环境中。

6、未本文档来自技高网...

【技术保护点】

1.一种基于流水数据的特征衍生系统,其特征在于,包括:

2.根据权利要求1所述的基于流水数据的特征衍生系统,其特征在于,所述模式识别采用自回归移动平均模型,所述自回归移动平均模型,包括如下公式:

3.根据权利要求2所述的基于流水数据的特征衍生系统,其特征在于,所述聚类分析均值算法公式包括:

4.根据权利要求3所述的基于流水数据的特征衍生系统,其特征在于,

5.根据权利要求4所述的基于流水数据的特征衍生系统,其特征在于,计算所述优化后内聚度值的公式包括:

6.根据权利要求5所述的基于流水数据的特征衍生系统,其特征在于,后处理模块中...

【技术特征摘要】

1.一种基于流水数据的特征衍生系统,其特征在于,包括:

2.根据权利要求1所述的基于流水数据的特征衍生系统,其特征在于,所述模式识别采用自回归移动平均模型,所述自回归移动平均模型,包括如下公式:

3.根据权利要求2所述的基于流水数据的特征衍生系统,其特征在于,所述聚类分析均值算法公式包括:

4.根据权利要求3所述的基于流水数据的特征衍生系统...

【专利技术属性】
技术研发人员:徐永桂郑斌张棉棉肖璐徐佳兰
申请(专利权)人:浙江农商数字科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1