【技术实现步骤摘要】
一种基于时间序列数据的分类算法
本专利技术涉及分类算法
,具体涉及一种基于时间序列数据的分类算法。
技术介绍
分类算法在互联网中有着广泛的应用。现实生活中我们各种各样的商品、物体需要分类,在互联网世界中分类的应用更是普遍,邮件需要分类(垃圾邮件、正常邮件)、图片需要分类、文本需要分类等等,分类几乎无处不在,同时分类算法也是非常的多,在各个领域都有相关的算法,也有成熟的应用,但在时间序列数据上,传统分类算法应用效果往往不是很好,由于基于时间序列的数据在分类时比较难于准确划分基础项,导致分类结果准确度不高,达不到满意的效果。
技术实现思路
本专利技术的目的在于克服现有技术中存在的问题,提供一种基于时间序列数据的分类算法,它可以实现提高分类的准确性。为实现上述技术目的,达到上述技术效果,本专利技术是通过以下技术方案实现的:一种基于时间序列数据的分类算法,其包括如下步骤:Step1,将每个采集点的原始数据按时间进行排序;Step2,确定时间间隔,认为在此时间间隔内的候选项都是一组的,并按设置的时间间隔,两两划分成组;Step3,统计每一项的频数;Step4,统计每一组的频数;Step5,计算每组数据的支持度,计算公式为:C(XY)/avg(C(X),C(Y))=组X与组Y中的项在一条记录中同时出现的次数/数据的个数;Step6,根据实际情况,排除掉支持度低的候选项;Step7,通过融合最终候选项,得出最终结果。进一步地,所述Step2中的按时间分组,只要在一个时间段内,同一个候选项可以被划分到多个分组里。进一步地,所述Step3中统计出的频数按其大小进行排序并剔 ...
【技术保护点】
1.一种基于时间序列数据的分类算法,其特征在于,其包括如下步骤:Step1,将每个采集点的原始数据按时间进行排序;Step2,确定时间间隔,认为在此时间间隔内的候选项都是一组的,并按设置的时间间隔,两两划分成组;Step3,统计每一项的频数;Step4,统计每一组的频数;Step5,计算每组数据的支持度,计算公式为:C(XY)/avg(C(X),C(Y))=组X与组Y中的项在一条记录中同时出现的次数/数据的个数;Step6,根据实际情况,排除掉支持度低的候选项;Step7,通过融合最终候选项,得出最终结果。
【技术特征摘要】
1.一种基于时间序列数据的分类算法,其特征在于,其包括如下步骤:Step1,将每个采集点的原始数据按时间进行排序;Step2,确定时间间隔,认为在此时间间隔内的候选项都是一组的,并按设置的时间间隔,两两划分成组;Step3,统计每一项的频数;Step4,统计每一组的频数;Step5,计算每组数据的支持度,计算公式为:C(XY)/avg(C(X),C(Y))=组X与组Y中的项在一条记录中同时出现的...
【专利技术属性】
技术研发人员:孟彦,韦建,章文友,朱静轩,
申请(专利权)人:中新网络信息安全股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。