一种医疗报告单照片中敏感信息脱敏方法及系统技术方案

技术编号:31921006 阅读:38 留言:0更新日期:2022-01-15 13:04
本发明专利技术公开了一种医疗报告单照片中敏感信息脱敏方法及系统,该方法包括以下步骤:S1、基于先验知识构建敏感信息范围;S2、读取当前医疗报告单照片,检测当前医疗报告单照片中的文本框并识别出文本内容;S3、根据敏感信息范围,结合使用关键词匹配和序列标注网络中的命名实体识别方法,对每个文本框的文本内容进行敏感信息的检测与识别;S4、对识别出的每个敏感信息的坐标进行定位;S5、根据定位出的坐标对敏感信息位置进行打码脱敏处理。本发明专利技术的医疗报告单照片中敏感信息脱敏方法及系统能够准确识别敏感信息并对敏感信息精准定位,最终实现对敏感信息的打码脱敏,具有可行性高、准确度高的优点。确度高的优点。确度高的优点。

【技术实现步骤摘要】
一种医疗报告单照片中敏感信息脱敏方法及系统


[0001]本专利技术涉及图像脱敏
,特别涉及一种医疗报告单照片中敏感信息脱敏方法及系统。

技术介绍

[0002]在大数据时代,人工智能发展迅猛,“互联网+医疗”成为我国医疗健康产业发展的新方向;信息共享给生活带来便捷的同时,个人敏感信息安全面临挑战。随着医疗信息系统的广泛应用,医疗报告单作为十分常见的文件,常常包含如病人姓名、病人编号、门诊号、联系方式、病人住址、医院、医生姓名等重要信息。因此,在智能医疗、在线问诊、医学研究等众多领域,经常会使用手机等设备拍摄医疗报告单照片,形成图像上传。为保证用户信息的安全性,在使用这些图像之前,对图像中的敏感信息进行“脱敏”就显得极为重要。
[0003]图像脱敏是指对敏感信息通过图像模糊、添加水印、添加马赛克等方式进行的信息遮挡,从而对图像中的敏感信息起到一定的保护作用。现有的图像脱敏技术在进行脱敏时多采用模板匹配、模板覆盖的脱敏技术,将提前准备好的替换模板放置于需要脱敏的图像位置。但是准备匹配模板的过程会增加图像前期处理的时间,使得图像脱敏效率低本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种医疗报告单照片中敏感信息脱敏方法,其特征在于,包括以下步骤:S1、基于先验知识构建敏感信息范围;S2、读取当前医疗报告单照片,检测当前医疗报告单照片中的文本框并识别出文本内容;S3、根据敏感信息范围,结合使用关键词匹配和序列标注网络中的命名实体识别方法,对每个文本框的文本内容进行敏感信息的检测与识别;S4、对识别出的每个敏感信息的坐标进行定位;S5、根据定位出的坐标对敏感信息位置进行打码脱敏处理。2.如权利要求1所述的医疗报告单照片中敏感信息脱敏方法,其特征在于,所述步骤S1包括:S11、从现有医疗报告单照片中整理归纳,构建敏感信息匹配关键词列表;S12、搜集整理医院名称列表,并进行拆分、合并处理得到医院名称关键词列表。3.如权利要求2所述的医疗报告单照片中敏感信息脱敏方法,其特征在于,敏感信息匹配关键词列表中的敏感信息包括:姓名、患者姓名、病人号、病人ID、病理号、病历号、病例号、病案号。4.如权利要求1所述的医疗报告单照片中敏感信息脱敏方法,其特征在于,步骤S2中,所述检测当前医疗报告单照片中的文本框并识别出文本内容,包括:通过OCR模型检测当前医疗报告单照片中的文本框并识别出文本内容,得到文本框坐标、文本内容与识别置信度。5.如权利要求1所述的医疗报告单照片中敏感信息脱敏方法,其特征在于,步骤S3包括:S31、遍历文本框,使用THULAC对每个文本框的文本识别内容进行分词,并标注词性,返回词性标注结果nes;S32、遍历词性标注结果nes,如果当前信息ne_text不在已保存的敏感信息列表ne_list中,则根据词性进行进一步判断;S33、关键词列表keyword_list匹配查找时,如果匹配关键词match_word和对应匹配信息ne_text被敏感信息检测识别在两个文本框,则无法脱敏,需要进一步二次处理;如果text_str文本长度不超过阈值skip_keyword_len,遍历关键词列表keyword_list,查找敏感信息match_word;S34、如果当前文本框字符串text_str中包含医院二字,遍历医院列表hosoital_list,查找是否有医院名称在当前字符串中text_str,如果有,将该医院hospital添加到敏感信息列表ne_list;S35、检测字符串text_str中的电子邮箱地址emails,如果emails不为空,则添加到敏感信息列表ne_list中;S36、经过步骤S34和S35步骤后,敏感信息列表ne_list中可能存在重复,在下一步遍历敏感信息ne_list之前进行一下去重处理;S37、遍历敏感信息列表ne_list中的每个敏感信息,查找当前文本框字符串text_str中该敏感信息出现的...

【专利技术属性】
技术研发人员:王珏
申请(专利权)人:苏州良医汇网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1