【技术实现步骤摘要】
本专利技术涉及数据挖掘领域,尤其涉及一种基于时间序列的数据挖掘方法及系统。
技术介绍
目前,随着计算机和网络应用的日益广泛以及不同领域的业务种类的日益丰富,针对海量的事件记录数据(例如金融领域中某类信用卡的交易记录数据)生成时间序列,然后进行数据挖掘以预测该事件在未来的变化趋势变得越来越重要。其中,时间序列预测在目标跟踪、天气预报、市场分析和故障诊断领域中有广泛的应用,传统的预测方法大都采用线性模型来近似地表达预测对象的发展规律。现有技术通过结合使用小波分析理论,对时间序列进行预处理,基于预处理之后的数据建模进行预测,但是现有的基于小波分析的时间序列预测模型存在以下缺点:因为现有的做法仅利用了特定事件本身的历史时间序列进行预测,忽略了影响特定事件的各种影响因素,比如零售行业与不同行业之间存在着一定的关联关系,制造业的景气程度会影响零售行业的供给能力,而房地产的快速发展将拉动零售行业的消费需求。因而现有的基于时间序列的数据预测方法得到的预测结果不够精确。
技术实现思路
本专利技术实施例提供一种基于时间序列的数据挖掘方法及系统,用以解决现有技术中存在预测结果不够准确的问题。本专利技术方法包括一种基于时间序列的数据挖掘方法,该方法包括:获取设定时间段内的原始事件记录,并根据所述原始事件记录确定一个基础事件类型和M个关联事件类型;根据所述原始事件记录生成与所述基础事件类型对应的的第一历史时间序列,并根据所述原始事件记录生成与M个关联事件类型对应的M个第二历史时间序列;对所述第一历史时间序列和所述M个第二历史时间序列进行小波分解,得到所述第一历史时间序列的低频时间序列 ...
【技术保护点】
一种基于时间序列的数据挖掘方法,其特征在于,该方法包括:获取设定时间段内的原始事件记录,并根据所述原始事件记录确定一个基础事件类型和M个关联事件类型;根据所述原始事件记录生成与所述基础事件类型对应的的第一历史时间序列,并根据所述原始事件记录生成与M个关联事件类型对应的M个第二历史时间序列;对所述第一历史时间序列和所述M个第二历史时间序列进行小波分解,得到所述第一历史时间序列的低频时间序列,以及所述M个第二历史时间序列的低频时间序列;针对每个第二历史时间序列的低频时间序列,计算所述第一历史时间序列的低频时间序列与每个第二历史时间序列的低频时间序列的关联系数;确定所述关联系数大于第一阈值的K个第二历史时间序列的低频时间序列,并根据所述K个第二历史时间序列的低频时间序列和所述第一历史时间序列的低频时间序列建立预测模型,并根据所述预测模型得到所述基础事件类型的预测值,其中M为正整数,K为不大于M的整数。
【技术特征摘要】
1.一种基于时间序列的数据挖掘方法,其特征在于,该方法包括:获取设定时间段内的原始事件记录,并根据所述原始事件记录确定一个基础事件类型和M个关联事件类型;根据所述原始事件记录生成与所述基础事件类型对应的的第一历史时间序列,并根据所述原始事件记录生成与M个关联事件类型对应的M个第二历史时间序列;对所述第一历史时间序列和所述M个第二历史时间序列进行小波分解,得到所述第一历史时间序列的低频时间序列,以及所述M个第二历史时间序列的低频时间序列;针对每个第二历史时间序列的低频时间序列,计算所述第一历史时间序列的低频时间序列与每个第二历史时间序列的低频时间序列的关联系数;确定所述关联系数大于第一阈值的K个第二历史时间序列的低频时间序列,并根据所述K个第二历史时间序列的低频时间序列和所述第一历史时间序列的低频时间序列建立预测模型,并根据所述预测模型得到所述基础事件类型的预测值,其中M为正整数,K为不大于M的整数。2.如权利要求1所述的方法,其特征在于,还包括:获取与所述基础事件类型相关的L个参考指标的L个第三历史时间序列;针对每个参考指标的第三历史时间序列,计算所述第一历史时间序列的低频时间序列与所述每个参考指标的第三历史时间序列的第一相关系数;确定第一相关系数大于第二阈值的Q个参考指标的第三历史时间序列,Q和T为不大于L的正整数;所述根据所述K个第二历史时间序列的低频时间序列和所述第一历史时间序列的低频时间序列建立预测模型,包括:利用所述K个第二历史时间序列的低频时间序列、Q个参考指标的第三历史时间序列和所述第一历史时间序列的低频时间序列建立第一模型。3.如权利要求2所述的方法,其特征在于,还包括:对所述第一历史时间序列进行小波分解,得到所述第一历史时间序列的N个高频时间序列,N为正整数;针对每个参考指标的第三历史时间序列,计算所述第一历史时间序列的N个高频时间序列和所述每个参考指标的第三历史时间序列的第二相关系数;确定第二相关系数大于第三阈值的T个参考指标的第三历史时间序列,其中,T为不大于L的正整数;针对所述第一历史时间序列的每个高频时间序列,利用所述T个参考指标的第三历史时间序列和所述第一历史时间序列的每个高频时间序列建立第二模型;所述根据所述预测模型得到所述基础事件类型的预测值,包括:根据所述第一模型和所述第二模型预测得到所述基础事件类型的预测值。4.如权利要求3所述的方法,其特征在于,还包括:所述第一模型为多元回归线性模型,所述第二模型为BP神经网络模型;根据所述第一模型和所述第二模型预测得到所述基础事件类型的预测值,包括:利用所述多元回归线性模型预测得到所述基础事件类型的的低频预测值;利用N个BP神经网络模型预测得到所述基础事件类型的N个高频预测值;将所述低频预测值和所述N个高频预测值求和,得到所述基础事件类型的预测值。5.如权利要求3所述的方法,其特征在于,所述计算所述第一历史时间序列的低频时间序列与所述每个参考指标的第三历史时间序列的第一相关系数,以及,计算所述第一历史时间序列的N个高频时间序列和所述每个参考指标的第三历史时间序列的第二相关系数,包括:利用皮尔逊相关系数的计算公式计算所述第一历史时间序列的低频时间序列与所述每个参考指标的第三历史时间序列的第一相关系数,以及利用皮尔逊相关系数的计算公式计算所述第一历史时间序列的N个高频时间序列和所述每个参考指标的第三历史时间序列的第二相关系数。6.如权利要求5所述的方法,其特征在于,所述皮尔逊相关系数的计算公式为: r X , Z = Σ n = 1 ( X n - X ‾ ) ( Z n - Z ‾ ) Σ n = 1 ( X n - X ‾ ) 2 Σ n = 1 ( Z n - Z ‾ ) 2 ]]>其中,Xn和Zn是时间序列,和分别是时间序列Xn和Zn的平均值,rX,Z为Xn和Zn的皮尔逊相关系数。7.如权利要求1至6任一项所述的方法,其特征在于,所述计算所述第一历史时间序列的低频时间序列与每个第二历史时间序列的低频时间序列的关联系数,包括...
【专利技术属性】
技术研发人员:钟毅,邱雪涛,赵金涛,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。