一种体格检查信息抽取方法、装置、设备及存储介质制造方法及图纸

技术编号:38135258 阅读:12 留言:0更新日期:2023-07-08 09:46
本申请公开了一种体格检查信息抽取方法、装置、设备及存储介质。该方法包括:接收目标用户的体格检查信息文本,将体格检查信息文本按照预设分句规则进行分句得到目标短句,根据第一预设归类规则确定目标短句对应的第一类别,根据第二预设归类规则确定目标短句对应的第二类别,根据第二类别确定目标短句的目标类别,根据目标类别对目标短句进行信息抽取得到关键信息,根据第一类别和关键信息生成目标用户的结构化信息数据。其中,通过将体格检查信息文本进行分句,避免由于体格检查信息文本过长导致的信息提取不准确,通过三次归类确定目标类别避免体格检查信息文本过于冗杂导致的提取关键信息不准确的问题,提高了关键信息提取的准确性和简洁度。取的准确性和简洁度。取的准确性和简洁度。

【技术实现步骤摘要】
一种体格检查信息抽取方法、装置、设备及存储介质


[0001]本申请涉及信息生成
,特别是涉及一种体格检查信息抽取方法、装置、设备及存储介质。

技术介绍

[0002]目前,患者的病历一般为电子病历,既可以随时打印成纸质版,又可以在医院进行存档,以便后续患者在复诊时医生可以进行查阅。
[0003]在现有技术中,以电子病历中的体格检查信息为例,体格检查信息的获取方法一般是将患者的检查结果进行汇总,然后采用“关键信息识别+正则提取”的方法对检查结果进行提取,并利用提取的结果生成具有一定结构的信息数据。但是,由于患者检查的项目比较多,可能会导致提取的结果不准确;且不同检查医生所记录的表述可能不一致,进而导致生成的信息数据的内容存在重复的问题。
[0004]基于此,如何提高体格检查信息抽取的准确性以及简洁度,是本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]基于上述问题,本申请提供了一种体格检查信息抽取方法、装置、设备及存储介质,以提高体格检查信息抽取的准确度以及简洁度。
[0006]本申请实施例公开了如下技术方案:
[0007]第一方面,本申请实施例提供一种体格检查信息抽取方法,所述方法包括:
[0008]接收目标用户的体格检查信息文本;
[0009]将所述体格检查信息文本按照预设分句规则进行分句,得到目标短句;
[0010]根据第一预设归类规则确定所述目标短句对应的第一类别;
[0011]根据第二预设归类规则确定所述目标短句对应的第二类别;
[0012]根据所述第二类别确定所述目标短句的目标类别;
[0013]根据所述目标类别对所述目标短句进行信息抽取,得到关键信息;
[0014]根据所述第一类别和所述关键信息生成所述目标用户的结构化信息数据。
[0015]可选地,所述根据第二预设归类规则确定所述目标短句对应的第二类别,包括:
[0016]对所述目标短句进行实体处理,得到至少一个目标关键词;
[0017]将所述至少一个目标关键词与预设实体信息进行匹配;
[0018]若存在匹配结果,则将所述目标短句标记为有归属,作为所述目标短句的第二类别;
[0019]若不存在匹配结果,则将所述目标短句标记为无归属,作为所述目标短句的第二类别。
[0020]可选地,所述根据所述第二类别确定所述目标短句的目标类别,包括:
[0021]若所述第二类别为有归属,则根据所述目标短句对应的至少一个目标关键词确定
目标类别。
[0022]可选地,所述根据所述第二类别确定所述目标短句的目标类别,包括:
[0023]若待确定目标类别的目标短句对应的第二类别为无归属,则判断所述目标短句是否为所述体格检查信息文本的首句;
[0024]若所述目标短句是所述体格检查信息文本的首句,则将所述目标短句标记为无目标类别;
[0025]若所述目标短句不是所述体格检查信息文本的首句,则将所述目标短句标记为所述目标短句的前一个目标短句所对应的目标类别。
[0026]可选地,所述根据所述目标类别对所述目标短句进行信息抽取,得到关键信息,包括:
[0027]根据所述目标类别确定与所述目标类别对应的正则表达式;
[0028]根据所述正则表达式对所述目标短句进行信息抽取,得到关键信息。
[0029]可选地,所述根据所述第一类别和所述关键信息生成所述目标用户的结构化信息数据,包括:
[0030]根据所述第一类别确定结构化信息数据生成模型中的检查项目名称;
[0031]通过所述结构化信息数据生成模型对所述关键信息进行处理,得到所述目标用户的结构化信息数据。
[0032]可选地,所述通过所述结构化信息数据生成模型对所述关键信息进行处理,得到所述目标用户的结构化信息数据,包括:
[0033]根据所述结构化信息数据生成模型将所述关键信息按照预设数据类型进行分类;
[0034]根据分类后的关键信息和所述检查项目名称对应的数据类型生成所述目标用户的结构化信息数据。
[0035]第二方面,本申请实施例提供一种体格检查信息抽取装置,所述装置包括:
[0036]接收模块,用于接收目标用户的体格检查信息文本;
[0037]目标短句获取模块,用于将所述体格检查信息文本按照预设分句规则进行分句,得到目标短句;
[0038]第一类别确定模块,用于根据第一预设归类规则确定所述目标短句对应的第一类别;
[0039]第二类别确定模块,用于根据第二预设归类规则确定所述目标短句对应的第二类别;
[0040]目标类别确定模块,用于根据所述第二类别确定所述目标短句的目标类别;
[0041]关键信息确定模块,用于根据所述目标类别对所述目标短句进行信息抽取,得到关键信息;
[0042]结构化信息数据生成模块,用于根据所述第一类别和所述关键信息生成所述目标用户的结构化信息数据。
[0043]第三方面,本申请实施例提供一种计算机设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面任一项所述的体格检查信息抽取方法。
[0044]第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介
质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如第一方面任一项所述的体格检查信息抽取方法。
[0045]相较于现有技术,本申请具有以下有益效果:
[0046]本申请通过接收目标用户的体格检查信息文本,将所述体格检查信息文本按照预设分句规则进行分句得到目标短句,根据第一预设归类规则确定所述目标短句对应的第一类别,根据第二预设归类规则确定所述目标短句对应的第二类别,根据所述第二类别确定所述目标短句的目标类别,根据所述目标类别对所述目标短句进行信息抽取得到关键信息,根据所述第一类别和所述关键信息生成所述目标用户的结构化信息数据。其中,通过将接收的体格检查信息文本进行分句,可以避免由于整个体格检查信息文本过长导致的信息提取不准确,然后对分句后的目标短句进行三次归类,得到目标类别,通过三次归类可以将目标短句的类别进行确定,避免体格检查信息文本过于冗杂导致的提取关键信息不准确的问题,提高了关键信息提取的准确性,且通过多次归类避免相同或相似的词语出现在提取得到的结构化信息数据中,提高关键信息提取的简洁度。
附图说明
[0047]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0048]图1为本申请实施例提供的一种体格检查信息抽取方法的流程图;
[0049]图2为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种体格检查信息抽取方法,其特征在于,所述方法包括:接收目标用户的体格检查信息文本;将所述体格检查信息文本按照预设分句规则进行分句,得到目标短句;根据第一预设归类规则确定所述目标短句对应的第一类别;根据第二预设归类规则确定所述目标短句对应的第二类别;根据所述第二类别确定所述目标短句的目标类别;根据所述目标类别对所述目标短句进行信息抽取,得到关键信息;根据所述第一类别和所述关键信息生成所述目标用户的结构化信息数据。2.根据权利要求1所述的体格检查信息抽取方法,其特征在于,所述根据第二预设归类规则确定所述目标短句对应的第二类别,包括:对所述目标短句进行实体处理,得到至少一个目标关键词;将所述至少一个目标关键词与预设实体信息进行匹配;若存在匹配结果,则将所述目标短句标记为有归属,作为所述目标短句的第二类别;若不存在匹配结果,则将所述目标短句标记为无归属,作为所述目标短句的第二类别。3.根据权利要求2所述的体格检查信息抽取方法,其特征在于,所述根据所述第二类别确定所述目标短句的目标类别,包括:若所述第二类别为有归属,则根据所述目标短句对应的至少一个目标关键词确定目标类别。4.根据权利要求2所述的体格检查信息抽取方法,其特征在于,所述根据所述第二类别确定所述目标短句的目标类别,包括:若待确定目标类别的目标短句对应的第二类别为无归属,则判断所述目标短句是否为所述体格检查信息文本的首句;若所述目标短句是所述体格检查信息文本的首句,则将所述目标短句标记为无目标类别;若所述目标短句不是所述体格检查信息文本的首句,则将所述目标短句标记为所述目标短句的前一个目标短句所对应的目标类别。5.根据权利要求1所述的体格检查信息抽取方法,其特征在于,所述根据所述目标类别对所述目标短句进行信息抽取,得到关键信息,包括:根据所述目标类别确定与所述目标类别对应的正则表达式;根据所述正则表达式对所述目标短句进行信息抽取,得到关键信息...

【专利技术属性】
技术研发人员:袁理陈联忠胡可云
申请(专利权)人:北京嘉和海森健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1