一种心理量表的数据预处理方法技术

技术编号:18239169 阅读:85 留言:0更新日期:2018-06-17 03:08
本发明专利技术公开了一种心理量表的数据预处理方法,其包括以下步骤:S1、从至少两个选项中获取待保留的选项和待删除的选项;获取至少两个已知患病信息的心理量表样本;S2、对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选项的预处理;根据已知患病信息的心理量表样本对心理量表题目进行属性约简,删除模糊题目,实现对心理量表题目的预处理。本发明专利技术能够降低心理测量数据中选项的模糊度,并解决属性较多而样本较少时无法约简属性的问题,从而有效挖掘心理测量数据,提取有价值信息。 1

A data preprocessing method for mental scale

The present invention discloses a data preprocessing method for a mental scale, which includes the following steps: S1, obtaining the options to be retained from at least two options and the options to be deleted; obtaining a mental scale sample of at least two known illness information; S2, the option of removing the deletion to the option to be reduced to the option to be retained. To the data set based on the reserved options set, the psychological scale option is pretreated; the mental scale subject is reduced, the fuzzy topic is deleted, and the preprocessing of the mental scale topic is realized. The invention can reduce the ambiguity of the options in psychological measurement data, and solve the problem that the attributes can not be reduced when the attributes are more and the sample is less, so that the psychological data can be excavated effectively and the valuable information is extracted. One

【技术实现步骤摘要】
一种心理量表的数据预处理方法
本专利技术涉及心理量表数据处理领域,具体涉及一种心理量表的数据预处理方法。
技术介绍
心理测试量表是评估心理疾病的重要手段,可辅助心理医生进行相关疾病的诊断。典型的心理量表是由若干问题组成的问卷,参与者需要根据自身心理和精神状况给出每个问题的答案。每个问题实际上都是用户的一个属性,而每个属性只有几种选项,分别表示症状的不同程度,例如严重的、一般的、轻微的。参与者只能从这几个选项中进行选择。很多未经培训的参与者很难识别心理量表中选项间模糊的界线,即很难区分不同选项。同时,如果他们不能准确理解量表中问题本身的意思,就会选择一些近似的选项,从而对医生确诊病情带来障碍。这些都会产生冗余属性。临床心理学自身的模糊性和心理测量数据的模糊性都将带来噪声。因此在从模糊心理测量数据中挖掘有价值信息和提取关键属性之前,有必要降低数据的模糊性。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的一种心理量表的数据预处理方法解决了心理量表选项间的模糊性。为了达到上述专利技术目的,本专利技术采用的技术方案为:提供一种心理量表的数据预处理方法,其包括以下步骤:S1、从至少两个选项中获取待保留的选项和待删除的选项;获取至少两个已知患病信息的心理量表样本;S2、对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选项的预处理;根据已知患病信息的心理量表样本对心理量表题目进行属性约简,删除模糊题目,实现对心理量表题目的预处理。进一步地,步骤S1中从至少两个心理量表样本的所有选项中获取待保留的选项和待删除的选项的具体包括如下子步骤:S1-1、初始化所有选项的集合O;S1-2、设定待保留选项的个数S′;S1-3、判断S′是否在2到之间,若是则进入步骤S1-4,否则返回步骤S1-2;其中S表示集合O中选项的个数;S1-4、根据公式得到待保留的选项之间的间隔;S1-5、根据公式N0=1+i×interval从第一个保留的选项开始逐一将编号为N0的选项加入到集合O′中;其中i是大于等于0的整数,1≤N0≤S;S1-6、判断集合O′中是否保留了集合O中最末端的选项,若是则进入步骤S1-7,否则进入步骤S1-8;S1-7、输出集合O′,得到待保留的选项,并进入步骤S1-9;S1-8、将集合O′中最末端的选项替换为集合O中最末端的选项,输出替换后的集合O′,得到待保留的选项,并进入步骤S1-9;S1-9、根据公式O‘’=O-O′得到待删除的选项集O‘’。进一步地,步骤S2中对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选项的预处理,具体包括如下子步骤:S2-1-1、从待删除的选项集O‘’中取出一个选项Q,并在待保留的选项中查找位于选项Q左侧的选项QL和位于选项Q右侧的选项QR,得到多个样本中选项Q的选中个数n,多个样本中选项QR的选中个数nR,多个样本中选项QL的选中个数nL;S2-1-2、根据公式得到选项Q的转换系数u;S2-1-3、根据公式PL=n×u,PR=n×(1-u)分别得到选项Q转换为选项QL的个数PL和选项Q转换为选项QR的个数PR;S2-1-4、将前PL个选择选项Q的题目修改为选择选项QL,将后PR个选择选项Q的题目修改为选择选项QR,得到基于保留选项集的数据集合。进一步地,步骤S1中所述已知患病信息的心理量表样本包括:正样本集Y:每个患病信息为未患病的被测人所完成的心理量表数据集;负样本集X:每个患病信息为患病的被测人所完成的心理量表数据集。进一步地,步骤S2中根据已知患病信息的心理量表样本对心理量表题目进行属性约简,删除模糊题目,实现对心理量表题目的预处理的具体方法为:S2-2-1、将所有正样本集Y划分为r个子集Yi,使在1到5之间,i=1,...,r;其中表示子集Yi中的样本数量;NX表示负样本集X中的样本数量;S2-2-2、将每个子集Yi与负样本集X组合成新的集合Ti‘;S2-2-3、根据属性约简方法对每个集合Ti‘进行属性约简,得到每个集合Ti‘中需要删除的题目;S2-2-4、删除所有集合Ti‘中删除次数最多的d个题目,实现模糊题目的删除,完成对心理量表题目的预处理。本专利技术的有益效果为:本专利技术能够降低心理测量数据中选项的模糊度,并解决属性较多而样本较少时无法约简属性的问题,从而有效挖掘心理测量数据,提取有价值信息。附图说明图1为本专利技术的流程示意图。具体实施方式下面对本专利技术的具体实施方式进行描述,以便于本
的技术人员理解本专利技术,但应该清楚,本专利技术不限于具体实施方式的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本专利技术的精神和范围内,这些变化是显而易见的,一切利用本专利技术构思的专利技术创造均在保护之列。如图1所示,该心理量表的数据预处理方法包括以下步骤:S1、从至少两个选项中获取待保留的选项和待删除的选项;获取至少两个已知患病信息的心理量表样本;S2、对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选项的预处理;根据已知患病信息的心理量表样本对心理量表题目进行属性约简,删除模糊题目,实现对心理量表题目的预处理。步骤S1中从至少两个心理量表样本的所有选项中获取待保留的选项和待删除的选项的具体包括如下子步骤:S1-1、初始化所有选项的集合O;S1-2、设定待保留选项的个数S′;S1-3、判断S′是否在2到之间,若是则进入步骤S1-4,否则返回步骤S1-2;其中S表示集合O中选项的个数;S1-4、根据公式得到待保留的选项之间的间隔;S1-5、根据公式N0=1+i×interval从第一个保留的选项开始逐一将编号为N0的选项加入到集合O′中;其中i是大于等于0的整数,1≤No≤S;S1-6、判断集合O′中是否保留了集合O中最末端的选项,若是则进入步骤S1-7,否则进入步骤S1-8;S1-7、输出集合O′,得到待保留的选项,并进入步骤S1-9;S1-8、将集合O′中最末端的选项替换为集合O中最末端的选项,输出替换后的集合O′,得到待保留的选项,并进入步骤S1-9;S1-9、根据公式O=O-O'得到待删除的选项集O‘’。步骤S2中对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选项的预处理,具体包括如下子步骤:S2-1-1、从待删除的选项集O‘’中取出一个选项Q,并在待保留的选项中查找位于选项Q左侧的选项QL和位于选项Q右侧的选项QR,得到多个样本中选项Q的选中个数n,多个样本中选项QR的选中个数nR,多个样本中选项QL的选中个数nL;S2-1-2、根据公式得到选项Q的转换系数u;S2-1-3、根据公式PL=nxu,PR=nx(1-u)分别得到选项Q转换为选项QL的个数PL和选项Q转换为选项QR的个数PR;S2-1-4、将前PL个选择选项Q的题目修改为选择选项QL,将后PR个选择选项Q的题目修改为选择选项QR,得到基于保留选项集的数据集合。步骤S1中所述已知患病信息的心理量表样本包括:正样本集Y:每个患病信息为未患病的被测人所完成的心理量表数据集;负样本集X:每个患病信息为患病的被测人所完成的心理量表数据集。步骤S2中根据已本文档来自技高网
...
一种心理量表的数据预处理方法

【技术保护点】
1.一种心理量表的数据预处理方法,其特征在于,包括以下步骤:

【技术特征摘要】
1.一种心理量表的数据预处理方法,其特征在于,包括以下步骤:S1、从至少两个选项中获取待保留的选项和待删除的选项;获取至少两个已知患病信息的心理量表样本;S2、对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选项的预处理;根据已知患病信息的心理量表样本对心理量表题目进行属性约简,删除模糊题目,实现对心理量表题目的预处理。2.根据权利要求1所述的心里量表的数据处理方法,其特征在于,所述步骤S1中从至少两个心理量表样本的所有选项中获取待保留的选项和待删除的选项的具体包括如下子步骤:S1-1、初始化所有选项的集合O;S1-2、设定待保留选项的个数S′;S1-3、判断S′是否在2到之间,若是则进入步骤S1-4,否则返回步骤S1-2;其中S表示集合O中选项的个数;S1-4、根据公式得到待保留的选项之间的间隔;S1-5、根据公式N0=1+i×interval从第一个保留的选项开始逐一将编号为N0的选项加入到集合O′中;其中i是大于等于0的整数,1≤N0≤S;S1-6、判断集合O′中是否保留了集合O中最末端的选项,若是则进入步骤S1-7,否则进入步骤S1-8;S1-7、输出集合O′,得到待保留的选项,并进入步骤S1-9;S1-8、将集合O′中最末端的选项替换为集合O中最末端的选项,输出替换后的集合O′,得到待保留的选项,并进入步骤S1-9;S1-9、根据公式O‘’=O-O′得到待删除的选项集O‘’。3.根据权利要求2所述的心理量表的数据预处理方法,其特征在于,所述步骤S2中对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选...

【专利技术属性】
技术研发人员:乔少杰熊熙韩楠舒红平薛学轩冉先进魏军林
申请(专利权)人:成都信息工程大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1