当前位置: 首页 > 专利查询>湖南大学专利>正文

累积效应识别方法及装置制造方法及图纸

技术编号:17138780 阅读:85 留言:0更新日期:2018-01-27 14:40
本发明专利技术提供了一种累积效应识别方法及装置,涉及数据挖掘技术领域。所述累积效应识别方法包括:获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果;基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。本发明专利技术提供的方法及装置基于动态变化规律的思想,通过将考虑了历史数据的多元拟合度与只考虑同期数据的二元拟合度对比,最后推断出影响因子对研究对象是否存在累积效应。

Method and device for recognition of cumulative effect

The invention provides a method and device for identifying the cumulative effect, which relates to the field of data mining technology. The cumulative effect of recognition method: acquiring preset time length of the object of study for the first time sequence and second time factor sequences, and according to the second time sequence of constructing the historical series factor; two yuan fitting result to obtain the research object and the influence factor, and multivariate fitting results of the first time sequence, the second time sequence and the sequence of history; two yuan based on the fitting results and the multivariate fitting results, to determine whether the influence factor on the object of study has the cumulative effect. The method and device provided by the invention are based on the idea of dynamic change rule, and by comparing the multivariate fitting degree of historical data with the two element fitting degree that only considers the data of the same period, we conclude whether there is cumulative effect of the influence factor on the research object.

【技术实现步骤摘要】
累积效应识别方法及装置
本专利技术涉及数据挖掘
,具体而言,涉及一种累积效应识别方法及装置。
技术介绍
近年来,中国正式开启大数据时代,每个行业各种各样的信息以及数据呈现爆炸式的增长,面对海量数据的处理,数据挖掘是一个必需的选择。数据挖掘是一门综合性的学科,它结合了其它基础学科的重要理论,其主要功能是提取出隐藏在大量数据中有用的模式和规则,其核心工作是分析各种参数之间相互影响的规律。在未考虑累积效应的数据挖掘算法中,对于时间序列的处理采用静态相似的算法,一般是从历史数据中挖掘与目标参数以及其它影响变量相似的数据,这种方法没有考虑数据之间存在的相关性,导致结果偏差较大。累积效应的本质是事物存在动态的规律变化特性,其转变了原有的由静态相似数据分析思维为动态相似数据分析思维。目前,学者们分析累积效应影响已经经验充足,但是累积效应的识别仍然停留在专家人工观测的阶段。对于参数变化不确定性大的研究对象,由于专家人工观测法严重依赖研究专家的个人经验,并需要消耗大量的时间与精力,才能确定累积效应的存在。此外,专家人工观测法并不具备普适性。对于新的数据,专家人工法又需要重新进行大量经验的积累,观测才能识别累积效应的存在。
技术实现思路
本专利技术的目的在于提供一种累积效应识别方法及装置,其能够有效改善上述问题。本专利技术的实施例是这样实现的:第一方面,本专利技术实施例提供了一种累积效应识别方法,所述方法包括:获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果;基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。第二方面,本专利技术实施例还提供了一种累积效应识别装置,其包括序列获取模块,用于获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;拟合结果获取模块,用于获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果;累积效应判断模块,用于基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。本专利技术实施例提供的累积效应识别方法及装置,先获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列,可获得所述研究对象与影响因子的同期数据,以及所述影响因子的历史数据;之后再获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果,即可获得所述研究对象与所述影响因子的同期数据的二元拟合结果,以及考虑到所述影响因子历史数据的多元拟合结果;最后,基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应,可通过将考虑了历史数据的多元拟合结果与只考虑同期数据的二元拟合结果对比,推断出所述影响因子对所述研究对象是否存在累积效应。和现有技术相比,本专利技术提供了一种有效且智能化的累积效应识别方法及装置,其基于动态变化规律的思想,不仅考虑了累积效应的研究对象与影响因子同期数据之间的关系,还考虑了研究对象与影响因子历史数据之间随时间的变化关系,通过将考虑了历史数据的多元拟合结果与只考虑同期数据的二元拟合结果对比,最后即可基于数据结果推断出是否存在累积效应,该方法并不依赖人工观测,适用于各个领域对累积效应的研究。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为一种可应用于本专利技术实施例中的电子设备的结构框图;图2为本专利技术第一实施例提供的累积效应识别方法的流程框图;图3为本专利技术第一实施例中步骤S200的子步骤流程框图;图4为本专利技术第一实施例中步骤S210的子步骤流程框图;图5为本专利技术第一实施例中步骤S220的子步骤流程框图;图6为本专利技术第一实施例中步骤S510的子步骤流程框图;图7为本专利技术第一实施例中步骤S520的子步骤流程框图;图8为本专利技术第一实施例提供的拟合度曲线图;图9为本专利技术第二实施例提供的累积效应识别装置的结构框图;图10为本专利技术第二实施例提供的序列获取模块的结构框图;图11为本专利技术第二实施例提供的拟合结果获取模块的结构框图;图12为本专利技术第二实施例提供的累积效应判断模块的结构框图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清晰、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。图1示出了一种可应用于本申请实施例中的电子设备100的结构框图。如图1所示,电子设备100可以包括存储器110、存储控制器120、处理器130、显示屏幕140和累积效应识别装置。例如,该电子设备100可以为个人电脑(personalcomputer,PC)、平板电脑、智能手机、个人数字助理(personaldigitalassistant,PDA)等。存储器110、存储控制器120、处理器130、显示屏幕140各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。所述累积效应识别方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器110中的软件功能模块,例如所述累积效应识别装置包括的软件功能模块或计算机程序。存储器110可以存储各种软件程序以及模块,如本申请实施例提供的累积效应识别方法及装置对应的程序指令/模块。处理器130通过运行存储在存储器110中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的累积效应识别方法。存储器110可以包括但不限于随机存取存储器(RandomAccessMemory,RAM),只读存储器(ReadOnlyMemory,ROM),可编程只读存储器(ProgrammableRead-OnlyMemory,PROM),可擦除只读存储器(ErasableProgrammableRead-OnlyMemory,EPROM),电可擦除只读存储器(ElectricErasableProgramm本文档来自技高网...
累积效应识别方法及装置

【技术保护点】
一种累积效应识别方法,其特征在于,所述方法包括:获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果;基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。

【技术特征摘要】
1.一种累积效应识别方法,其特征在于,所述方法包括:获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列;获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果;基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。2.根据权利要求1所述的方法,其特征在于,获取预设时间长度内的研究对象的第一时间子序列以及影响因子的第二时间子序列,并根据所述第二时间子序列构建所述影响因子的历史序列,包括:获取总长度都为n且同期的研究对象序列X1和影响因子序列Y1;从所述研究对象序列X1和所述影响因子序列Y1中分别选取第i到第n个元素组成的所述研究对象序列的第一时间子序列Xi,以及所述影响因子序列的第二时间子序列Yi;根据所述第二时间子序列Yi分别构建所述影响因子的历史序列Yi1,Yi2,……,Yik,其中,所述Yi=(yi,yi+1,……,yn),Yik=(yi-k,yi-k+1,……,yn-k)。3.根据权利要求2所述的方法,其特征在于,获取所述研究对象和所述影响因子的二元拟合结果,以及所述第一时间子序列、所述第二时间子序列和所述历史序列的多元拟合结果,包括:根据预设二元拟合函数对所述研究对象序列X1和所述影响因子序列Y1做二元拟合,获得所述X1和所述Y1的二元拟合结果;根据预设多元拟合函数对所述第一时间子序列Xi、第二时间子序列Yi和所述历史序列Yi1,Yi2,……,Yik做多元拟合,获得所述Xi,Yi,Yi1,Yi2,……,Yik的多元拟合结果。4.根据权利要求3所述的方法,其特征在于,基于所述二元拟合结果及所述多元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应,包括:基于所述多元拟合结果获取拟合度曲线;在所述拟合度曲线上按照预设规则选取收敛点;基于所述收敛点的拟合度和所述二元拟合结果,判断所述影响因子对所述研究对象是否存在累积效应。5.根据权利要求4所述的方法,其特征在于,在所述拟合度曲线上按照预设规则选取收敛点,包括:以i=2,k=1为初始值,判断所述拟合度曲线上第(i-1)点的拟合度是否趋于收敛,若判断结果为否,输入i=i+1,k=k+1,执行从所述研究对象序列X1和所述影响因子序列Y1中分别选取第i到第n个元素组成的所述研究对象序列的第一时间子序列Xi,以及所述...

【专利技术属性】
技术研发人员:黎灿兵颜博文张迪周斌曹一家刘新东周珑
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1