当前位置: 首页 > 专利查询>武轲专利>正文

一种多值定性比较分析数据处理方法技术

技术编号:13781434 阅读:61 留言:0更新日期:2016-10-04 18:10
本发明专利技术涉及一种多值定性比较分析数据处理方法,它采用如下的步骤方法:选取想要被分析的解释变量和被解释变量,通过计算Nc(ri)来进行初步筛选候选规则;通过计算Cc(ri)来进行进一步筛选,然后计算Complex及Parsimonious分析结果,再使用反设事实计算,生成初步Intermediate分析结果。随后,fm-QCA会自动计算每条规则的相关覆盖率和一致性,并对其可信度进行印证;得到最终的Intermediate分析结果。它具用支持多值解释变量及被解释变量的数据,实现多值逻辑化简,Intermediate solution自动生成和引入候选项集一致性检测,提高分析精度等优点。

【技术实现步骤摘要】

本专利技术涉及一种多值定性比较分析数据处理方法
技术介绍
定性比较分析方法(Qualitative Comparative Analysis,简称Q C A)是由国际著名社会学家、政治学家Ragin于1987年提出的数据分析方法。该方法能够分析因素及因素组合(Configuration)对事件结果影响关系,从而帮助寻找更好的事件归因解释,适用于国家外交危机、国际战争爆发、社会革命事件等重大事件分析。该方法白提出以来,在国际上得到了广泛应用,其中Dixon在2004年将其应用到工业领域[2];Amenta在2005年[3]、Hagan&Hansford-Bowles在2005年[4]、Osa&Corduneanu-Huci在2003年[5]分别将其应用到社会运动的研究;Wickham-Crowley在1991年将其应用于社会革命研究[7]。该方法相比回归分析等其他分析方法具有独到优势,在社会学及国际政治学领域占有重要地位。对于国际QCA领域而言,当前知名QCA方法包括csQCA、fsQCA以及mvQCA。其中csQCA支持布尔数据集,fsQCA支持模糊数据集,mvQCA支持多值数据集。在研究中我们发现,对于众多社会学、政治学问题,多值数据具有更好的解释力度。但csQCA、fsQCA不能支持多值数据分析,mvQCA虽能导出分析结果,却不能给出最具参考意义的Intermediate solution。同时由于其内部算法原因,不能实现完备的多值逻辑化简,也不能支持被解释变量为多值的情况, 从而导致最终分析结果不能满足社会学、政治学专家分析需要。对于国内而言,目前多值定性比较分析方法研究及其软件领域仍处于一片空白,亟待出现相应方法弥补空缺。
技术实现思路
本专利技术的目的在于针对现有技术的缺陷和不足,提供一种框架统一,设计合理、使用方便的一种多值定性比较分析数据处理方法,它所提出的多值定性比较的数据分析方法(fm-QCA),成功克服了现有QCA方法在多值定性比较分析领域的不足;它具用支持被解释变量及解释变量均为多值数据,实现多值逻辑化简,Intermediate solution自动生成和引入候选项集一致性检测,提高分析精度等优点。为实现上述目的,本专利技术采用的技术方案是:本专利技术所述的一种多值定性比较分析数据处理方法,它采用如下的步骤方法:1)选择解释变量和被解释变量:步骤1:收集相关的需要分析的大量数据;步骤2:针对具体的需分析的情况,从步骤一选择与其相关联的数据;步骤3:分析开始前需要选取想要被分析的解释变量和被解释变量;2)生成候选规则:步骤4:根据步骤三所选取的解释和被解释变量,fm-QCA自动生成候选规则,通过Nc(ri)来进行初步筛选来实现;该规则被进一步检验后将被用于生成Complex及Parsimonious分析结果;3)计算Nc(ri)来进行初步筛选:步骤5:Nc(ri)是用来筛选候选规则是否有真实案例支撑的一个重要指标,该指标能够筛选出具有相符案例的规则,其计算方法如下: A C E ( e j , c k ) = 1 Σ i = 1 n ck | e j { v i本文档来自技高网
...

【技术保护点】
一种多值定性比较分析数据处理方法,其特征在于:它采用如下的步骤方法:1)选择解释变量和被解释变量:步骤1:收集相关的需要分析的大量数据;步骤2:针对具体的需分析的情况,从步骤一选择与其相关联的数据;步骤3:分析开始前需要选取想要被分析的解释变量和被解释变量;2)生成候选规则:步骤4:根据步骤三所选取的解释和被解释变量,fm‑QCA自动生成候选规则,通过Nc(ri)来进行初步筛选来实现;该规则被进一步检验后将被用于生成Complex及Parsimonious分析结果;3)计算Nc(ri)来进行初步筛选:步骤5:Nc(ri)是用来筛选候选规则是否有真实案例支撑的一个重要指标,该指标能够筛选出具有相符案例的规则,其计算方法如下:ACE(ej,ck)=1Σi=1nck|ej{vi}-ck{vi}|=00Σi=1nck|ej{vi}-ck{vi}|≠0]]>Nc(ri)=Σj=1ncACE(ej,ck),]]>步骤6:设定筛选阈值λ,该筛选阈值λ可由人为指定,只有那些真实案例支撑数大于或等于阈值λ的规则才会被用于生成最终结果,形成候选规则A;步骤7:而那些小于该值的候选规则B则会被保留下来,设定为Remainders,并且参与到Intermediate结果生成中;4)计算Cc(ri)来进行进一步筛选:步骤8:根据步骤6,对于真实案例支撑数大于或等于阈值λ的规则的候选规则A,利用Cc(ri)来进一步筛选。该Cc(ri)是候选规则的一致性筛选指标,其计算方法如下:AOE(ej,ok{m})=1ej{o}=m0ej{o}≠m]]>CC(ri)=Σj=1ncmin{ACE(ej,ck),AOE(ej,ok{m})}Σj=1ncACE(ej,ck),]]>步骤9:在多值情况中,考虑到被解释变量的组合情况,此时可用C′C(ri)来代替Cc(ri)的计算过程,如下:CC′(ri)=Σj=1ncmin{ACE(ej,ck),T}Σj=1ncACE(ej,ck),]]>步骤10:设定筛选阈值μ,该筛选阈值μ同样可由用户指定,利用步骤9的计算方法,只有一致性大于或等于μ的规则会被用于生成Intermediate结果,形成候选规则C;步骤11:小于筛选阈值μ的候选规则D则会被丢掉,设定为Drop Rule;5)计算Complex及Parsimonious分析结果,如下:步骤12:生成用于产生Complex及Parsimonious分析结果的规则集合,方法如下(Rscpx Rspas):Rcpx=S(Ra)Rscpx={r|r∈Rcpx∧Nc(r)>1}R′remainders={r|r∈Rremainders∧J(r)=1}Rpas=S{Ra∪R′remainders}Rspas={r|r∈Rpas∧Nc(r)>1};步骤13:生成Complex及Parsimonious分析结果:Complex分析结果由由上述4)中保留的候选规则C进行逻辑化简而生成的;Parsimonious分析结果由4)中保留的候选规则C及3)中的Remainders共同进行多值逻辑化简而得到;6)反设事实计算:其采如下步骤:步骤14:Intermediate分析结果综合了Complex及Parsimonious两个分析结果;步骤15:根据步骤14,将专家的知识考虑在内,形成最有意义的分析结果;步骤16:在fm‑QCA方法中,利用反设事实技术,该技术能够确定一个Remainder在现实中是否容易出现或很难出现;基于反事实,4)中保留的候选规则C及部分经过反设事实推理而得到的部分Remainders可以归并到一起,并通过多值逻辑化简从而生成Intermediate分析结果,具体如下Rsitm:包含在r1R′itm=S(Ritm)Rsitm={r|r∈R′itm∧Nc(r)>1}7)计算覆盖率和一致性,其采用如下步骤:步骤17:生成Intermediate分析结果后,fm‑QCA会自动计算每条规则的相关覆盖率和一致性,并对其可信度进行印证;8)得到最终的Intermediate分析结果,其如下步骤:步骤18:只有覆盖率和一致性达到一定标准的规则才会保留下来成为最终的结果,而不符合的规则将被舍弃,经过这个过程后,Intermediate结果将变为可信任的最终分析结果,该结果能够揭示出我们想要得到的解释变量及被解释变量之间的关系,帮助我们分析结果之间的内在因果关系。...

【技术特征摘要】
1.一种多值定性比较分析数据处理方法,其特征在于:它采用如下的步骤方法:1)选择解释变量和被解释变量:步骤1:收集相关的需要分析的大量数据;步骤2:针对具体的需分析的情况,从步骤一选择与其相关联的数据;步骤3:分析开始前需要选取想要被分析的解释变量和被解释变量;2)生成候选规则:步骤4:根据步骤三所选取的解释和被解释变量,fm-QCA自动生成候选规则,通过Nc(ri)来进行初步筛选来实现;该规则被进一步检验后将被用于生成Complex及Parsimonious分析结果;3)计算Nc(ri)来进行初步筛选:步骤5:Nc(ri)是用来筛选候选规则是否有真实案例支撑的一个重要指标,该指标能够筛选出具有相符案例的规则,其计算方法如下: A C E ( e j , ...

【专利技术属性】
技术研发人员:武轲唐世平蒲戈光吴敏
申请(专利权)人:武轲唐世平
类型:发明
国别省市:上海;31

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1