【技术实现步骤摘要】
一种病人主索引数据的清洗方法
本专利技术涉及一种病人主索引数据的清洗方法,属于医疗信息化
技术介绍
随着医疗信息化技术的发展,医院信息系统中病人诊疗数据的质量和完整性越来越重要。我国医院信息系统应用近20年,经过不断的升级换代,医疗数据不断扩展和累积,数据量非常庞大,但历史数据的可用性较低,问题在于病人主索引数据的大量冗余,导致以病人主索引数据为索引的诊疗数据的低可用性。病人主索引信息中含有有效身份证号的可以唯一确认其身份,但存在大量一个身份证号多条主索引的情况,而对于主索引信息中不含有效身份证号的则很难确认其身份的唯一性,尤其是历史数据中的病人主索引信息不完整,直接导致了以这些不完整病人主索引数据为索引的诊疗数据的低可用性,在很大程度上造成了医疗资源的浪费并延误了病人的诊疗进程。因此,尽可能减少病人主索引数据的冗余量,提供一种病人主索引数据的清洗方法,以满足挖掘历史诊疗数据的需求,保证病人主索引数据的唯一性具有重要意义。
技术实现思路
本专利技术的目的是为解决上述问题而提供的一种病人主索引数据的清洗方法,实现病人主索引数据的清洗,提高历史诊疗数据的可用性。 ...
【技术保护点】
一种病人主索引数据的清洗方法,其特征在于,它包括主索引关键词分类、主索引相似度计算和病人身份主索引表。所述的主索引关键词分类,是将病人主索引信息中的关键词,按其不同属性,分为具有身份唯一性属性、具有排他性属性和具有强相似性属性三类。所述的主索引相似度计算,是将当前主索引数据中的关键词数据与其它主索引数据中的相应关键词数据进行相似性计算。所述的病人身份主索引表,是能够确立病人身份唯一性的索引表,是病人主索引的索引表,由身份证号和病人ID为主键,病人主索引清洗后的数据存入该表中。
【技术特征摘要】
1.一种病人主索引数据的清洗方法,其特征在于,它包括主索引关键词分类、主索引相似度计算和病人身份主索引表。所述的主索引关键词分类,是将病人主索引信息中的关键词,按其不同属性,分为具有身份唯一性属性、具有排他性属性和具有强相似性属性三类。所述的主索引相似度计算,是将当前主索引数据中的关键词数据与其它主索引数据中的相应关键词数据进行相似性计算。所述的病人身份主索引表,是能够确立病人身份唯一性的索引表,是病人主索引的索引表,由身份证号和病人ID为主键,病人主索引清洗后的数据存入该表中。2.如权利要求1所述的一种病人主索引数据的清洗方法,其特征在于,步骤如下:1)开始;2)检索当前病人主索引信息;3)判断当前病人主索引信息中身份证号是否为有效的一代或二代身份证,如果...
【专利技术属性】
技术研发人员:王兴强,
申请(专利权)人:济南德健信息技术有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。