The invention provides a method and device for identifying the cumulative effect, which relates to the field of data mining technology. The cumulative effect of recognition method: acquiring preset time length of the object of study for the first time sequence and second time factor sequences, and according to the second time sequence of constructing the historical series factor; two yuan fitting result to obtain the research object and the influence factor, and multivariate fitting results of the first time sequence, the second time sequence and the sequence of history; two yuan based on the fitting results and the multivariate fitting results, to determine whether the influence factor on the object of study has the cumulative effect. The method and device provided by the invention are based on the idea of dynamic change rule, and by comparing the multivariate fitting degree of historical data with the two element fitting degree that only considers the data of the same period, we conclude whether there is cumulative effect of the influence factor on the research object.
【技术实现步骤摘要】
累积效应识别方法及装置
本专利技术涉及数据挖掘
,具体而言,涉及一种累积效应识别方法及装置。
技术介绍
近年来,中国正式开启大数据时代,每个行业各种各样的信息以及数据呈现爆炸式的增长,面对海量数据的处理,数据挖掘是一个必需的选择。数据挖掘是一门综合性的学科,它结合了其它基础学科的重要理论,其主要功能是提取出隐藏在大量数据中有用的模式和规则,其核心工作是分析各种参数之间相互影响的规律。在未考虑累积效应的数据挖掘算法中,对于时间序列的处理采用静态相似的算法,一般是从历史数据中挖掘与目标参数以及其它影响变量相似的数据,这种方法没有考虑数据之间存在的相关性,导致结果偏差较大。累积效应的本质是事物存在动态的规律变化特性,其转变了原有的由静态相似数据分析思维为动态相似数据分析思维。目前,学者们分析累积效应影响已经经验充足,但是累积效应的识别仍然停留在专家人工观测的阶段。对于参数变化不确定性大的研究对象,由于专家人工观测法严重依赖研究专家的个人经验,并需要消耗大量的时间与精力,才能确定累积效应的存在。此外,专家人工观测法并不具备普适性。对于新的数据,专家人工法又需要重新进行大量经验的积累,观测才能识别累积效应的存在。
技术实现思路
本专利技术的目的在于提供一种累积效应识别方法及装置,其能够有效改善上述问题。本专利技术的实施例是这样实现的:第一方面,本专利技术实施例提供了一种累积效应识别方法,所述方法包括:获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;获取所述研究对象和所述影响因子的二元拟合 ...
【技术保护点】
一种累积效应识别方法,其特征在于,所述方法包括:获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果;基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。
【技术特征摘要】
1.一种累积效应识别方法,其特征在于,所述方法包括:获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果;基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。2.根据权利要求1所述的方法,其特征在于,获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列,包括:获取总长度都为n且同期的研究对象序列X1和影响因子序列Y1;从所述研究对象序列X1和所述影响因子序列Y1中分别选取第i到第n个元素组成的所述研究对象序列的第一时间子序列Xi,以及所述影响因子序列的第二时间子序列Yi;根据所述第二时间子序列Yi分别构建所述影响因子的历史序列Yi1,Yi2,……,Yik,其中,所述Yi=(yi,yi+1,……,yn),Yik=(yi-k,yi-k+1,……,yn-k)。3.根据权利要求2所述的方法,其特征在于,获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果,包括:根据预设二元拟合函数对所述研究对象序列X1和所述影响因子序列Y1做二元拟合,获得所述X1和所述Y1的二元拟合结果;根据预设多元拟合函数对所述第一时间子序列Xi、第二时间子序列Yi和所述历史序列Yi1,Yi2,……,Yik做多元拟合,获得所述Xi,Yi,Yi1,Yi2,……,Yik的多元拟合结果。4.根据权利要求3所述的方法,其特征在于,基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应,包括:基于所述多元拟合结果获取拟合度曲线;在所述拟合度曲线上按照预设规则选取收敛点;基于所述收敛点的拟合度和所述二元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。5.根据权利要求4所述的方法,其特征在于,在所述拟合度曲线上按照预设规则选取收敛点,包括:以i=2,k=1为初始值,判断所述拟合度曲线上第(i-1)点的拟合度是否趋于收敛,若判断结果为否,输入i=i+1,k=k+1,执行从所述研究对象序列X1和所述影响因子序列Y1中分别选取第i到第n个元素组成的所述研究对象序列的第一时间子序列Xi,以及所述...
【专利技术属性】
技术研发人员:黎灿兵,颜博文,张迪,周斌,曹一家,刘新东,周珑,
申请(专利权)人:湖南大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。