当前位置: 首页 > 专利查询>蚌埠医学院专利>正文

一种医学空缺数据弥补方法技术

技术编号:19263445 阅读:38 留言:0更新日期:2018-10-27 02:22
本发明专利技术公开了一种医学空缺数据弥补方法,该方法包括以下步骤:步骤1、找出哪些聚集记录包含空缺值;步骤2、对于聚焦数据集中每一个包含空缺值的聚集记录,根据原始数据集中的已知数据元组,计算数据空缺值的数量;步骤3、根据医学数据的具体情况,设定空缺值的最低值和最高值;步骤4、根据步骤2计算的数据空缺值的数量和步骤3的设定值进行比对,确定医学空缺数据弥补采用的具体方法。本发明专利技术的医学空缺数据弥补方法,针对空缺值数量的多少,进行相应的处理,能有效减小数据挖掘算法与实际应用之间的差距,处理后的医学数据系统完备化程度较高,适合推广应用。

A remedy method for medical vacancy data

The invention discloses a medical vacancy data compensation method, which comprises the following steps: step 1, finding out which aggregation records contain vacancy values; step 2, calculating the number of data vacancies according to the known data tuples in the original data set for each aggregation record containing vacancy values in the focused data set; Step 3. Set the minimum and maximum of the vacancy value according to the specific situation of the medical data; Step 4, compare the number of the vacancy value calculated according to step 2 with the set value of step 3, and determine the specific method of making up the medical vacancy data. The medical vacancy data compensation method of the invention can effectively reduce the gap between the data mining algorithm and the actual application by processing the number of vacancies, and the processed medical data system has a high degree of completeness, which is suitable for popularization and application.

【技术实现步骤摘要】
一种医学空缺数据弥补方法
本专利技术属于医学
,涉及一种医学空缺数据弥补方法。
技术介绍
众所周知,由于网络带宽的限制,目前国内的医学网站大多以文字信息为主,而这种现状已经无法满足21世纪医学界在教学科研、资源共享、远程交流等方面的需要。近年来,,互联网的普及与发展,极大的推动了全球信息化和网络化的进程,互联网上丰富的医学信息资源正慢慢成为医学信息的巨大宝库。在这两种需求下,而医学数据库也就应运而生了。在计算机中,数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合。而当数据库运用到医院系统中时,既能够改变传统医学文档存储方式的冗余和不易查找的问题,又能够维护医学文档的统一性和权威性。在针对医学数据挖掘各个环节过程中,数据不完全的现象是不可避免的,存在着不同程度的空缺数据,也称为空缺值。为了能在生物医学研究领域中有效地应用数据挖掘的方法和系统,就必须面对数据不完整的挑战。
技术实现思路
本专利技术的目的在于提供一种医学空缺数据弥补方法。其具体技术方案为:一种医学空缺数据弥补方法,包括以下步骤:步骤1、找出哪些聚集记录包含空缺值;步骤2、对于聚焦数据集中每一个包含空缺值的聚集本文档来自技高网...

【技术保护点】
1.一种医学空缺数据弥补方法,其特征在于,包括以下步骤:步骤1、找出哪些聚集记录包含空缺值;步骤2、对于聚焦数据集中每一个包含空缺值的聚集记录,根据原始数据集中的已知数据元组,计算数据空缺值的数量;步骤3、根据医学数据的具体情况,设定空缺值的最低值和最高值;步骤4、根据步骤2计算的数据空缺值的数量和步骤3的设定值进行比对,确定医学空缺数据弥补采用的具体方法;如果空缺值的数量小于最低设定值,就直接将存在缺失信息属性值的记录删除,从而得到一个完备的信息表;如果空缺值的数量大于最低设定值但是小于最多设定值,根据决策表中其余对象取值的分布情况来对一个空值进行填充;如果空缺值的数量大于最高设定值,则不处...

【技术特征摘要】
1.一种医学空缺数据弥补方法,其特征在于,包括以下步骤:步骤1、找出哪些聚集记录包含空缺值;步骤2、对于聚焦数据集中每一个包含空缺值的聚集记录,根据原始数据集中的已知数据元组,计算数据空缺值的数量;步骤3、根据医学数据的具体情况,设定空缺值的最低值和最高值;步骤4、根据步骤2计算的数据空缺值的数量和步骤3的设定值进行比对,确定医学空缺数据弥补采用的具体方法;如果空缺值的数量小于最低设定值,就直接将存在缺失信息属性值的记录删除,从而得到一个完备的信息表;如果空缺值的数量大于最低设定值但是小于最多设定值,...

【专利技术属性】
技术研发人员:魏星常雪莲邵东芳谢静陈玉娥蒋秀林张德成陈友春朱文婕
申请(专利权)人:蚌埠医学院
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1