【技术实现步骤摘要】
一种病历信息的相似度分析方法、装置及设备
本申请涉及数据处理领域,具体涉及一种病历信息的相似度分析方法、装置及设备。
技术介绍
病历信息包括患者在就医过程中的全部用药、诊疗行为等整个医疗过程中的信息,目前,医疗监管部门发现存在医生利用病历模板伪造病历信息,套取医保基金的违法行为,造成医保基金的严重损失。为此,目前亟需一种能够及时发现并处理上述利用病历模板伪造病历信息套取医保基金的违法行为的有效方法,减少医保基金的损失。
技术实现思路
为此,本申请提供了一种病历信息的相似度分析方法、装置及设备,能够对病历信息进行相似度分析,及时发现并处理利用病历模板伪造病历信息套取医保基金的违法行为,减少医保基金的损失。第一方面,本申请提供了一种病历信息的相似度分析方法,所述方法包括:基于业务分析需求,获取满足所述业务分析需求的患者的病历信息,所述病历信息包括若干属性信息;利用方差分析算法,剔除各个病历信息中离散度大于预设第一阈值的属性信息;提取各个病历信息对应的特征向量;并计算各个病历信息对应的特征向量之间的相似度;将相似度大于预设第二阈值的特征向量对应的病历信息确定为相似病历信息。 ...
【技术保护点】
1.一种病历信息的相似度分析方法,其特征在于,所述方法包括:基于业务分析需求,获取满足所述业务分析需求的患者的病历信息,所述病历信息包括若干属性信息;利用方差分析算法,剔除各个病历信息中离散度大于预设第一阈值的属性信息;提取各个病历信息对应的特征向量;并计算各个病历信息对应的特征向量之间的相似度;将相似度大于预设第二阈值的特征向量对应的病历信息确定为相似病历信息。
【技术特征摘要】
1.一种病历信息的相似度分析方法,其特征在于,所述方法包括:基于业务分析需求,获取满足所述业务分析需求的患者的病历信息,所述病历信息包括若干属性信息;利用方差分析算法,剔除各个病历信息中离散度大于预设第一阈值的属性信息;提取各个病历信息对应的特征向量;并计算各个病历信息对应的特征向量之间的相似度;将相似度大于预设第二阈值的特征向量对应的病历信息确定为相似病历信息。2.根据权利要求1所述的方法,其特征在于,所述提取各个病历信息对应的特征向量之前,还包括:根据预先建立的转换表,将所述病历信息中的文本格式的属性信息转换成数值格式;其中,所述转换表中存储有所述属性信息的文本格式与数值格式的对应关系。3.根据权利要求1所述的方法,其特征在于,所述计算各个病历信息对应的特征向量之间的相似度,包括:利用余弦距离算法,计算各个病历信息对应的特征向量之间的相似度。4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:基于所述相似病历信息,确定发生伪造病历套取医保基金行为的对象;所述对象包括医院或医生。5.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:对所述相似病历信息进行统计分析,确定任一疾病的基本治疗信息,所述基本治疗信息用于为所述疾病的患者提供参考。6.一种病历信息的相似度分析装置,其特征在...
【专利技术属性】
技术研发人员:周宇,赵鹏,
申请(专利权)人:生活空间沈阳数据技术服务有限公司,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。