病历分类方法、系统、终端及存储介质技术方案

技术编号:38016085 阅读:10 留言:0更新日期:2023-06-30 10:41
本发明专利技术提供了一种病历分类方法、系统、终端及存储介质,该方法包括:对待分类病历的病历图像进行文本识别,得到病历文本,并根据病历文本对病历图像进行关键词检测;若病历文本的关键词检测合格,则对病历文本进行关键词匹配,得到关键词匹配结果;若关键词匹配结果未满足关键词分类条件,则对病历文本进行正则匹配,得到文本正则匹配结果;若文本正则匹配结果未满足正则匹配分类条件,则对病历文本进行文书分类预测,得到文书分类预测结果;若文书分类预测结果未满足预设分类条件,则对病历图像进行目标检测,并根据目标检测结果确定待分类病历的文书类别。本发明专利技术能有效地确定纸质的待分类病历的文书类别,提高了病历分类的准确性。性。性。

【技术实现步骤摘要】
病历分类方法、系统、终端及存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种病历分类方法、系统、终端及存储介质。

技术介绍

[0002]随着科技的不断进步,人们生活水平的不断提高,现有的医疗体系不断丰富,例如:省级医院、市级医院、区级医院和乡镇级医院,每个医院体系在运行过程中都需要处理海量的医疗数据,在医疗数据的处理过程中,病历分类的处理尤为重要。
[0003]现有的病历分类过程中,一般是对电子病历进行分类,电子病历可以直接获取标准结构化文本,而当需要进行纸质病历的分类时,则无法有效地进行病历分类,降低了病历分类的准确性。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种病历分类方法、系统、终端及存储介质,旨在解决现有的病历分类准确性低下的问题。
[0005]本专利技术实施例是这样实现的,一种病历分类方法,所述方法包括:
[0006]对待分类病历的病历图像进行文本识别,得到病历文本,并根据病历文本对所述病历图像进行关键词检测;
[0007]若所述病历文本的关键词检测合格,则对所述病历文本进行关键词匹配,得到关键词匹配结果;
[0008]若所述关键词匹配结果未满足关键词分类条件,则对所述病历文本进行正则匹配,得到文本正则匹配结果;
[0009]若所述文本正则匹配结果未满足正则匹配分类条件,则对所述病历文本进行文书分类预测,得到文书分类预测结果;
[0010]若所述文书分类预测结果未满足预设分类条件,则对所述病历图像进行目标检测,并根据所述目标检测结果确定所述待分类病历的文书类别。
[0011]优选的,所述若所述病历文本的关键词检测合格之后,还包括:
[0012]获取所述病历文本中前预设行数的文本信息,得到抽取文本,并对所述抽取文本进行文本框检测;
[0013]若所述抽取文本的文本框检测合格,则对所述抽取文本进行正则匹配,得到文本框正则匹配结果,并根据所述文本框正则匹配结果确定所述待分类病历的文书类别。
[0014]优选的,所述对所述抽取文本进行文本框检测,包括:
[0015]判断所述抽取文本中是否存在居中的文本检测框;
[0016]若所述抽取文本中存在所述居中的文本检测框,则获取所述居中的文本检测框与相邻文本检测框之间的空隙距离,并计算所述空隙距离与所述病历图像的图像宽度之间的距离比值;
[0017]若所述距离比值大于预设比值,则判定所述抽取文本的文本框检测合格。
[0018]优选的,所述对所述病历文本进行关键词匹配,包括:
[0019]获取所述病历文本中的文本检测框,并根据所述文本检测框确定所述病历文本的文本关键词集合;
[0020]将所述文本关键词集合与各预设类别关键词集合进行交集,得到交集关键词数目;
[0021]若最大所述关键词数目小于数目阈值,则判定所述关键词匹配结果未满足所述关键词分类条件。
[0022]优选的,所述将所述文本关键词集合与各预设类别关键词集合进行交集,得到交集关键词数目之后,还包括:
[0023]若最大所述关键词数目大于或等于所述数目阈值,则判定所述关键词匹配结果满足所述关键词分类条件,并将最大所述关键词数目对应所述预设类别关键词集合确定为目标关键词集合;
[0024]将所述目标关键词集合对应的文书类别,确定为所述待分类病历的文书类别。
[0025]优选的,所述根据所述目标检测结果确定所述待分类病历的文书类别,包括:
[0026]分别获取所述目标检测结果中各边界框的边界框得分,并根据所述边界框得分对各边界框进行筛选,得到候选边界框;
[0027]对各候选边界框进行非极大值抑制处理,得到目标边界框,并将所述目标边界框的边界参数分别与各预设边界参数进行匹配;
[0028]若任一所述预设边界参数与所述目标边界框的边界参数相匹配,则将所述预设边界参数对应的文书类别,确定为所述待分类病历的文书类别。
[0029]优选的,所述根据病历文本对所述病历图像进行关键词检测,包括:
[0030]将所述病历文本中的文本词汇与预设置的黑名单关键词进行匹配;
[0031]若所述病历文本中的文本词汇与所述黑名单关键词均不匹配,则判定所述病历文本的关键词检测合格;
[0032]若任一所述黑名单关键词与所述病历文本中的文本词汇相匹配,则判定所述病历文本的关键词检测不合格。
[0033]本专利技术实施例的另一目的在于提供一种病历分类系统,所述系统包括:
[0034]关键词检测模块,用于对待分类病历的病历图像进行文本识别,得到病历文本,并根据病历文本对所述病历图像进行关键词检测;
[0035]关键词匹配模块,用于若所述病历文本的关键词检测合格,则对所述病历文本进行关键词匹配,得到关键词匹配结果;
[0036]正则匹配模块,用于若所述关键词匹配结果未满足关键词分类条件,则对所述病历文本进行正则匹配,得到文本正则匹配结果;
[0037]文书分类模块,用于若所述文本正则匹配结果未满足正则匹配分类条件,则对所述病历文本进行文书分类预测,得到文书分类预测结果;
[0038]目标检测模块,用于若所述文书分类预测结果未满足预设分类条件,则对所述病历图像进行目标检测,并根据所述目标检测结果确定所述待分类病历的文书类别。
[0039]本专利技术实施例的另一目的在于提供一种终端设备,包括存储器、处理器以及存储
在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。
[0040]本专利技术实施例的另一目的在于提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
[0041]本专利技术实施例,通过对待分类病历的病历图像进行文本识别,使得无需传统病历分类所需要的结构化电子病历,提高了病历分类的分类效率,通过对病历图像进行关键词检测、对病历文本进行正则匹配、对病历文本进行文书分类预测、对病历图像进行目标检测,能有效地确定纸质的待分类病历的文书类别,提高了病历分类的准确性。
附图说明
[0042]图1是本专利技术第一实施例提供的病历分类方法的流程图;
[0043]图2是本专利技术第二实施例提供的病历分类方法的流程图;
[0044]图3是本专利技术第三实施例提供的病历分类系统的结构示意图;
[0045]图4是本专利技术第四实施例提供的病历分类系统具体实施步骤的示意图;
[0046]图5是本专利技术第五实施例提供的终端设备的结构示意图。
具体实施方式
[0047]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0048]为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。...

【技术保护点】

【技术特征摘要】
1.一种病历分类方法,其特征在于,所述方法包括:对待分类病历的病历图像进行文本识别,得到病历文本,并根据病历文本对所述病历图像进行关键词检测;若所述病历文本的关键词检测合格,则对所述病历文本进行关键词匹配,得到关键词匹配结果;若所述关键词匹配结果未满足关键词分类条件,则对所述病历文本进行正则匹配,得到文本正则匹配结果;若所述文本正则匹配结果未满足正则匹配分类条件,则对所述病历文本进行文书分类预测,得到文书分类预测结果;若所述文书分类预测结果未满足预设分类条件,则对所述病历图像进行目标检测,并根据所述目标检测结果确定所述待分类病历的文书类别。2.如权利要求1所述的病历分类方法,其特征在于,所述若所述病历文本的关键词检测合格之后,还包括:获取所述病历文本中前预设行数的文本信息,得到抽取文本,并对所述抽取文本进行文本框检测;若所述抽取文本的文本框检测合格,则对所述抽取文本进行正则匹配,得到文本框正则匹配结果,并根据所述文本框正则匹配结果确定所述待分类病历的文书类别。3.如权利要求2所述的病历分类方法,其特征在于,所述对所述抽取文本进行文本框检测,包括:判断所述抽取文本中是否存在居中的文本检测框;若所述抽取文本中存在所述居中的文本检测框,则获取所述居中的文本检测框与相邻文本检测框之间的空隙距离,并计算所述空隙距离与所述病历图像的图像宽度之间的距离比值;若所述距离比值大于预设比值,则判定所述抽取文本的文本框检测合格。4.如权利要求1所述的病历分类方法,其特征在于,所述对所述病历文本进行关键词匹配,包括:获取所述病历文本中的文本检测框,并根据所述文本检测框确定所述病历文本的文本关键词集合;将所述文本关键词集合与各预设类别关键词集合进行交集,得到交集关键词数目;若最大所述关键词数目小于数目阈值,则判定所述关键词匹配结果未满足所述关键词分类条件。5.如权利要求4所述的病历分类方法,其特征在于,所述将所述文本关键词集合与各预设类别关键词集合进行交集,得到交集关键词数目之后,还包括:若最大所述关键词数目大于或等于所述数目阈值,则判定所述关键词匹配结果满足所述关键词分类条件,并将最大所述关键词数目对应所述预设类别关键词集合确定为目标关键词集合;将所...

【专利技术属性】
技术研发人员:仇旭刘升平梁家恩
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1