本发明专利技术公开了一种用于医生胜任力模型构建的数据处理方法,包括数据筛选、数据分解、无效数据二次筛选、有效数据单元的二次融合和无效数据单元的处理这五个步骤,与现有技术相比,本发明专利技术通过对现有技术中进行剔除的无效数据进行重新利用,大大减少了由于数据剔除而对原始数据样本信息的损失。在对无效数据进行二次利用的同时保持了原始有效数据的可靠性。
【技术实现步骤摘要】
本专利技术涉及一种数据处理方法,尤其涉及。
技术介绍
关于医学人才培养模式研究的文献有很多,大多通过制定专门性培养方案、培养模式、师资建设、建立健全保障体系等措施培养卓越医师。在对医生胜任力评价体系中,需要对大量的复杂统计数据进行筛选处理,从而剔除相对无效的数据,减小数据处理的工作量,提高数据处理的效率。现有技术的研究重点是对如何优选数据。但是,无论如何优选,只要剔除数据,就会对样本本身所要体现的信息产生偏差影响,无法实现样本信息的充分利用。
技术实现思路
本专利技术的目的就在于为了解决上述问题而提供。 本专利技术通过以下技术方案来实现上述目的: 本专利技术包括以下步骤: (I)数据筛选:先后使用KMO数据值、巴菲力特球形检验数据对源数据进行筛选,选取KMO数据值大于0.5和巴菲力特球形检验数据小于0.05的数据为有效数据,其余数据为无效数据; (2)数据分解:将所有数据按照数据内容的不同分成若干个维度; (3)无效数据二次筛选:筛选出有效数据中每个数据维度的最大值和最小值,然后使用无效数据每个维度中的数据单元与相同维度中有效数据的最大值和最小值进行比较,若无效数据中的数据单元位于有效数据的最大值和最小值之间,则将这一无效数据中这一维度的数据单元标记为有效数据单元,否则,继续标记为无效数据单元; (4)有效数据单元的二次融合:计算每个有效数据各维度的平均值,然后将无效数据中标记为有效数据单元的数据代替相应维度的平均值,其它维度仍然使用本维度的平均值,形成一个新的有效数据单元,将所有新得到的有效数据单元使用第一加权因子进行加权处理后,融合入原有的有效数据单元中; (5)无效数据单元的处理:将步骤C中仍然标记为无效的数据单元按照维度的相关性进行重新排序,然后对各个维度进行权重排序,按照维度权重值由低到高的顺序依次选取各个维度的无效数据单元作为目标值对其相邻的无效数据单元进行线性拟合,拟合出的各个维度的数据组成的曲面作为医生胜任力模型构建的二次检查标准。 进一步,步骤(4)中,第一加权因子的计算公式为: a= l/elw 核Ftt2Il O 步骤(4)中,将融合后形成的新的有效数据再次进行步骤(I)中的筛选过程,如果符合步骤(I)中的标准,则无需追加处理,如果不符合步骤(I)中的标准,则对第一加权因子进行调整,直至新的有效数据符合步骤(I)的标准。对第一加权因子进行调整的步骤为:选取第一加权因子的1%作为迭代步长,任意选取正向或负向迭代,通过迭代前后的结果变化率和迭代结果与目标结果差值的绝对值的计算,确定下一次迭代变化量,其关系为, q = D/k。 本专利技术的有益效果在于: 本专利技术是,与现有技术相比,本专利技术通过对现有技术中进行剔除的无效数据进行重新利用,大大减少了由于数据剔除而对原始数据样本信息的损失。在对无效数据进行二次利用的同时保持了原始有效数据的可靠性。 【具体实施方式】 下面对本专利技术作进一步说明: 本专利技术包括以下步骤: (I)数据筛选:先后使用KMO数据值、巴菲力特球形检验数据对源数据进行筛选,选取KMO数据值大于0.5和巴菲力特球形检验数据小于0.05的数据为有效数据,其余数据为无效数据; (2)数据分解:将所有数据按照数据内容的不同分成若干个维度; (3)无效数据二次筛选:筛选出有效数据中每个数据维度的最大值和最小值,然后使用无效数据每个维度中的数据单元与相同维度中有效数据的最大值和最小值进行比较,若无效数据中的数据单元位于有效数据的最大值和最小值之间,则将这一无效数据中这一维度的数据单元标记为有效数据单元,否则,继续标记为无效数据单元; (4)有效数据单元的二次融合:计算每个有效数据各维度的平均值,然后将无效数据中标记为有效数据单元的数据代替相应维度的平均值,其它维度仍然使用本维度的平均值,形成一个新的有效数据单元,将所有新得到的有效数据单元使用第一加权因子进行加权处理后,融合入原有的有效数据单元中; (5)无效数据单元的处理:将步骤C中仍然标记为无效的数据单元按照维度的相关性进行重新排序,然后对各个维度进行权重排序,按照维度权重值由低到高的顺序依次选取各个维度的无效数据单元作为目标值对其相邻的无效数据单元进行线性拟合,拟合出的各个维度的数据组成的曲面作为医生胜任力模型构建的二次检查标准。其曲面方程优选为球面方程x2+y2+z2 = R2或椭球面方程x2/a2+y2/b2+Z2/c2 = I。 具体地,所述步骤(4)中,第一加权因子的计算公式为: O 式中:Xn为新有效数据的第η维数据单元,yn为与此新有效数据欧式距离最近的源数据中的有效数据的第η维数据单元。 步骤(4)中,将融合后形成的新的有效数据再次进行步骤(I)中的筛选过程,如果符合步骤(I)中的标准,则无需追加处理,如果不符合步骤(I)中的标准,则对第一加权因子进行调整,直至新的有效数据符合步骤(I)的标准。对第一加权因子进行调整的步骤为:选取第一加权因子的1%作为迭代步长,任意选取正向或负向迭代,通过迭代前后的结果变化率和迭代结果与目标结果差值的绝对值的计算,确定下一次迭代变化量,其关系为, q = D/k。 式中:k为迭代前后的结果变化率,D为迭代结果与目标结果差值的绝对值,q为下一次迭代变化量。 上述有效/无效数据由多个维度的有效/无效数据单元组成,处理过程是通过对有效/无效数据单元的处理从而实现对有效/无效数据进行处理。 在使用上述数据处理方法前,需要对数据样本进行收集和整理。 通过访谈法与标准文献总结相结合的途径来建立胜任力要素辞典。对访谈录音进行文本化处理和频次分析,选取访谈过程中出现频率大于30 %的品质和事件进行整理,并把个性化的具有中医特点的特征统一提炼出来,用符合中医语言习惯的方式进行描述。此后,把品质特征作尝试性的定义,有的定义在GMER、教育部标准等相应要求中可以找到,但大多数需要自己来描述和确认。获得的29项品质特征。将访谈所得的29项特征结合国际GMER标准(《全球医学教育最低基本要求》)进行改编,参照结合《中医学本科(CMD前)教育毕业生基本要求》标准,分析关于中医医生胜任素质的文献,将标准进行操作化定义。在29项特征基础上进行了量表题目的编制,每一项特征进行了问题的设计,最终形成胜任力特征辞典。 在此中医卓越胜任力辞典的基础上,进一步对71项品质和问题进行排查筛选,采取李克特五点计分形成量表。对每个项目的得分进行专家组和对照组的独立样本T检验,检验结果显著说明该项目在专家组和对照组之间存在差异,能够起到鉴别出专家与普通医生的作用,该项目鉴别力较好。检验结果不显著说明该项目专家组和对照组之间差异不显著,不能很好的鉴别出专家与普通医生,该项目鉴别力较差。以专家组和对照组之间独立样本T检验结果作为项目分析的鉴别力标准,有22个项目由于没有达到显著性水平,不能起到鉴别的作用被删除。其余49个项目由于T检验结果达到显著性,鉴别力较好而被保留。将保留的49道题目以随机方式编制成初测问卷。 对包含49道题项的220份数据进行探索性因子分析,KMO数据值为0.849,巴菲力特球形检验显著性水平P < 0.00本文档来自技高网...
【技术保护点】
一种用于医生胜任力模型构建的数据处理方法,其特征在于,包括以下步骤:(1)数据筛选:先后使用KMO数据值、巴菲力特球形检验数据对源数据进行筛选,选取KMO数据值大于0.5和巴菲力特球形检验数据小于0.05的数据为有效数据,其余数据为无效数据;(2)数据分解:将所有数据按照数据内容的不同分成若干个维度;(3)无效数据二次筛选:筛选出有效数据中每个数据维度的最大值和最小值,然后使用无效数据每个维度中的数据单元与相同维度中有效数据的最大值和最小值进行比较,若无效数据中的数据单元位于有效数据的最大值和最小值之间,则将这一无效数据中这一维度的数据单元标记为有效数据单元,否则,继续标记为无效数据单元;(4)有效数据单元的二次融合:计算每个有效数据各维度的平均值,然后将无效数据中标记为有效数据单元的数据代替相应维度的平均值,其它维度仍然使用本维度的平均值,形成一个新的有效数据单元,将所有新得到的有效数据单元使用第一加权因子进行加权处理后,融合入原有的有效数据单元中;(5)无效数据单元的处理:将步骤C中仍然标记为无效的数据单元按照维度的相关性进行重新排序,然后对各个维度进行权重排序,按照维度权重值由低到高的顺序依次选取各个维度的无效数据单元作为目标值对其相邻的无效数据单元进行线性拟合,拟合出的各个维度的数据组成的曲面作为医生胜任力模型构建的二次检查标准。...
【技术特征摘要】
1.一种用于医生胜任力模型构建的数据处理方法,其特征在于,包括以下步骤: (1)数据筛选:先后使用KMO数据值、巴菲力特球形检验数据对源数据进行筛选,选取KMO数据值大于0.5和巴菲力特球形检验数据小于0.05的数据为有效数据,其余数据为无效数据; (2)数据分解:将所有数据按照数据内容的不同分成若干个维度; (3)无效数据二次筛选:筛选出有效数据中每个数据维度的最大值和最小值,然后使用无效数据每个维度中的数据单元与相同维度中有效数据的最大值和最小值进行比较,若无效数据中的数据单元位于有效数据的最大值和最小值之间,则将这一无效数据中这一维度的数据单元标记为有效数据单元,否则,继续标记为无效数据单元; (4)有效数据单元的二次融合:计算每个有效数据各维度的平均值,然后将无效数据中标记为有效数据单元的数据代替相应维度的平均值,其它维度仍然使用本维度的平均值,形成一个新的有效数据单元,将所有新得到的有效数据单元使用第一加权因子进行加权处理后,融合入原有的有效数据单元中; (5)无效数据单元的处理:将步骤C中仍然标...
【专利技术属性】
技术研发人员:金阿宁,
申请(专利权)人:金阿宁,
类型:发明
国别省市:吉林;22
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。