System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种医疗费用清单明细识别结果的后处理方法及装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>南开大学专利>正文

一种医疗费用清单明细识别结果的后处理方法及装置制造方法及图纸

技术编号:40867635 阅读:2 留言:0更新日期:2024-04-08 16:33
本发明专利技术公开一种医疗费用清单明细识别结果的后处理方法及装置,涉及计算机处理技术领域,在获取待处理医疗费用清单明细的识别结果和开具待处理医疗费用清单明细的医院的医院编码后,将识别结果和医院编码与预先建立的医疗知识图谱进行匹配,得到匹配结果,进一步基于匹配结果确定识别结果的可信度判断结果,本发明专利技术基于知识图谱图匹配的方式筛选出可信度较高的医疗费用清单明细,从而减少大量的人工成本,准确率高且开发成本低。

【技术实现步骤摘要】

本专利技术涉及计算机处理,特别是涉及一种医疗费用清单明细识别结果的后处理方法及装置


技术介绍

1、医疗费用清单明细图片经过ocr识别后仍然存在部分错误,需要大量人工进行复查。目前,为了减少人工复查,常用的方法包括:

2、(1)基于规则的方法

3、通过事先定义好的规则,筛选出符合规则的医疗费用清单明细,从而减少人工复查。但该基于规则的方法存在以下缺陷:可扩展性较差,对于新的情况需要手动添加规则,工作量大;需要专业人员制定规则,因此开发成本高,且存在人为主观性。

4、(2)基于机器学习的方法

5、通过训练机器学习模型,判断医疗费用清单明细的可信度,从而减少人工复查。但该基于机器学习的方法存在以下缺陷:需要大量标注好的数据集进行训练,收集和标注数据集的成本很高;模型泛化能力有限,对于新的场景可能表现不佳;对于某些较为复杂的情况,需要深度学习等复杂的技术,带来较高的计算资源和时间成本。

6、(3)基于ocr技术的方法

7、通过优化ocr算法,提高识别准确度,从而减少人工复查。但该基于ocr技术的方法存在以下缺陷:对于特殊的字体、光线、倾斜等情况,识别准确度会降低;对于一些手写、印刷不清晰的文本,识别效果也不佳;识别错误率高,需要人工进行二次校对和修正。

8、基于此,亟需一种准确率高且开发成本低的医疗费用清单明细识别结果的后处理技术。


技术实现思路

1、本专利技术的目的是提供一种医疗费用清单明细识别结果的后处理方法及装置,基于知识图谱图匹配的方式筛选出可信度较高的医疗费用清单明细,从而减少大量的人工成本,准确率高且开发成本低。

2、为实现上述目的,本专利技术提供了如下方案:

3、第一方面,本专利技术用于提供一种医疗费用清单明细识别结果的后处理方法,所述后处理方法包括:

4、获取待处理医疗费用清单明细的识别结果和开具所述待处理医疗费用清单明细的医院的医院编码;所述识别结果包括药品名称和药品价格;

5、将所述识别结果和所述医院编码与预先建立的医疗知识图谱进行匹配,得到匹配结果;所述医疗知识图谱包括多个三元组,每一所述三元组均包括药品实体、单价实体关系和价格实体;所述药品实体的属性包括药品名称和药品出现次数,所述单价实体关系的属性包括医院编码和关系出现次数,所述价格实体的属性包括药品价格;

6、基于所述匹配结果确定所述识别结果的可信度判断结果。

7、在一些实施例中,所述医疗知识图谱的构建方法包括:

8、获取多个历史医疗费用清单明细的历史识别结果;

9、对于每一所述历史识别结果,从所述历史识别结果中提取得到药品名称和药品价格;

10、基于医院编码信息文件确定开具每一所述历史医疗费用清单明细的医院的医院编码;

11、基于所有所述历史医疗费用清单明细的药品名称、药品价格和医院编码构建医疗知识图谱。

12、在一些实施例中,所述基于所有所述历史医疗费用清单明细的药品名称、药品价格和医院编码构建医疗知识图谱,具体包括:

13、将每一所述历史医疗费用清单明细的药品名称、药品价格和医院编码均形成一个三元组,所述三元组的药品出现次数和关系出现次数为1;

14、对于每一所述三元组,判断所述三元组中除药品出现次数和关系出现次数之外的其他内容是否与已存储的三元组中除药品出现次数和关系出现次数之外的其他内容相同;

15、若是,则将所述三元组与已存储的三元组进行合并存储,并将合并后的三元组的药品出现次数和关系出现次数加1;

16、若否,则将所述三元组进行直接存储,得到已存储的三元组;所有所述三元组均存储完成后,得到医疗知识图谱。

17、在一些实施例中,所述将所述识别结果和所述医院编码与预先建立的医疗知识图谱进行匹配,得到匹配结果,具体包括:判断所述识别结果和所述医院编码与预先建立的医疗知识图谱中的任意一个三元组是否匹配;若是,则匹配结果为匹配成功;若否,则匹配结果为匹配失败。

18、在一些实施例中,所述基于所述匹配结果确定所述识别结果的可信度判断结果,具体包括:

19、若所述匹配结果为匹配成功,则确定所述识别结果的可信度判断结果为可信;

20、若所述匹配结果为匹配失败,则获取所述识别结果中药品名称的识别置信度以及所述识别结果中药品名称在所述医疗知识图谱中的药品出现次数;根据所述识别结果中药品名称的长度、识别置信度和药品出现次数确定所述识别结果的可信度判断结果。

21、在一些实施例中,所述根据所述识别结果中药品名称的长度、识别置信度和药品出现次数确定所述识别结果的可信度判断结果,具体包括:

22、判断所述识别结果中药品名称的长度是否大于第一预设值,所述识别结果中药品名称的识别置信度是否大于第二预设值,且所述识别结果中药品名称的药品出现次数是否大于第三预设值;

23、若是,则所述识别结果的可信度判断结果为可信;若否,则所述识别结果的可信度判断结果为不可信。

24、在一些实施例中,所述第一预设值为5;所述第二预设值为0.9;所述第三预设值为20。

25、在一些实施例中,所述医疗知识图谱存储在neo4j数据库中。

26、第二方面,本专利技术用于提供一种医疗费用清单明细识别结果的后处理装置,所述后处理装置包括:

27、获取模块,用于获取待处理医疗费用清单明细的识别结果和开具所述待处理医疗费用清单明细的医院的医院编码;所述识别结果包括药品名称和药品价格;

28、匹配模块,用于将所述识别结果和所述医院编码与预先建立的医疗知识图谱进行匹配,得到匹配结果;所述医疗知识图谱包括多个三元组,每一所述三元组均包括药品实体、单价实体关系和价格实体;所述药品实体的属性包括药品名称和药品出现次数,所述单价实体关系的属性包括医院编码和关系出现次数,所述价格实体的属性包括药品价格;

29、判断模块,用于基于所述匹配结果确定所述识别结果的可信度判断结果。

30、在一些实施例中,所述判断模块具体包括:

31、第一判断单元,用于若所述匹配结果为匹配成功,则确定所述识别结果的可信度判断结果为可信;

32、第二判断单元,用于若所述匹配结果为匹配失败,则获取所述识别结果中药品名称的识别置信度以及所述识别结果中药品名称在所述医疗知识图谱中的药品出现次数;根据所述识别结果中药品名称的长度、识别置信度和药品出现次数确定所述识别结果的可信度判断结果。

33、根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:

34、本专利技术用于提供一种医疗费用清单明细识别结果的后处理方法及装置,在获取待处理医疗费用清单明细的识别结果和开具待处理医疗费用清单明细的医院的医院编码后,将识别结果和医院编码与预先建立的医疗知识图谱进行匹配,得到匹配结果,进一步基于匹配结果确定本文档来自技高网...

【技术保护点】

1.一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述后处理方法包括:

2.根据权利要求1所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述医疗知识图谱的构建方法包括:

3.根据权利要求2所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述基于所有所述历史医疗费用清单明细的药品名称、药品价格和医院编码构建医疗知识图谱,具体包括:

4.根据权利要求1所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述将所述识别结果和所述医院编码与预先建立的医疗知识图谱进行匹配,得到匹配结果,具体包括:判断所述识别结果和所述医院编码与预先建立的医疗知识图谱中的任意一个三元组是否匹配;若是,则匹配结果为匹配成功;若否,则匹配结果为匹配失败。

5.根据权利要求1所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述基于所述匹配结果确定所述识别结果的可信度判断结果,具体包括:

6.根据权利要求5所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述根据所述识别结果中药品名称的长度、识别置信度和药品出现次数确定所述识别结果的可信度判断结果,具体包括:

7.根据权利要求6所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述第一预设值为5;所述第二预设值为0.9;所述第三预设值为20。

8.根据权利要求1所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述医疗知识图谱存储在Neo4j数据库中。

9.一种医疗费用清单明细识别结果的后处理装置,其特征在于,所述后处理装置包括:

10.根据权利要求9所述的一种医疗费用清单明细识别结果的后处理装置,其特征在于,所述判断模块具体包括:

...

【技术特征摘要】

1.一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述后处理方法包括:

2.根据权利要求1所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述医疗知识图谱的构建方法包括:

3.根据权利要求2所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述基于所有所述历史医疗费用清单明细的药品名称、药品价格和医院编码构建医疗知识图谱,具体包括:

4.根据权利要求1所述的一种医疗费用清单明细识别结果的后处理方法,其特征在于,所述将所述识别结果和所述医院编码与预先建立的医疗知识图谱进行匹配,得到匹配结果,具体包括:判断所述识别结果和所述医院编码与预先建立的医疗知识图谱中的任意一个三元组是否匹配;若是,则匹配结果为匹配成功;若否,则匹配结果为匹配失败。

5.根据权利要求1所述的一种医疗费用清单明细识别结果的后处理...

【专利技术属性】
技术研发人员:张玉志王瑾瑜孙羽菲
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1