一种基于电子病历推断发病时间的方法技术

技术编号:37157812 阅读:15 留言:0更新日期:2023-04-06 22:20
本发明专利技术属于医疗信息处理技术领域,具体涉及一种基于电子病历推断发病时间的方法,包括以下步骤:通过医院系统获取患者的电子病历;对电子病历进行处理,将其保存为xml文件,识别获取电子病历中的主诉语段;利用正则表达式对提取的主诉语段进行解析,识别其中的时间语段;将识别的时间语段中的数字从汉字转换为阿拉伯数字;将时间语段转换为小时单位的时间;获取患者的入院时间,并减去时间段,得到患者发病时间的时间点。通过Xpath技术对患者的主诉进行索引和提取,提取其中与患者发病相关的语段,然后通过正则表达式获取主诉语段中关于时间的语段,再根据时间语段确定患者的发病时间,有助于患者的诊断和治疗。有助于患者的诊断和治疗。有助于患者的诊断和治疗。

【技术实现步骤摘要】
一种基于电子病历推断发病时间的方法


[0001]本专利技术属于医疗信息处理
,具体涉及一种基于电子病历推断发病时间的方法。

技术介绍

[0002]2020年7月,国家卫生健康委发布了《关于进一步加强单病种质量管理与控制工作的通知》,进一步明确了对单病种质控的要求,旨在提高医院的质控控制水平。
[0003]单病种的质量管理与电子病历有很重要的关系,电子病历里记录了患者治疗的信息。
[0004]时间作为电子病历中重要的实体,表示患者从入院到出院期间不同阶段的病情变化,有着重要的作用。对时间的标准化,以及相关联疾病的临床事件抽取,可促进临床辅助决策与信息挖掘。发病时间作为单病种疾病流程管理的起点时间,可以用来判断患者得病之后的变化情况,以此来判断疾病的时间长短与疾病变化速度,对疾病的治疗与管理有着重要的参考意义。
[0005]在临床中,医生会根据电子病历的主诉来判断,而电子病历与相关的信息化系统里并没有疾病发病时间的记录,计算机也没法利用这部分信息。因此,本专利提出一种基于电子病历的主诉内容来推断发病时间的方法,对时间进行标准化,推动对单病种质量的自动化管理。

技术实现思路

[0006]本专利技术的目的在于提供一种基于电子病历推断发病时间的方法,克服了现有技术的不足,对病历主诉进行分析,获取其中的时间语段,从而确定患者的发病时间,有助于患者的诊断和治疗。
[0007]为解决上述问题,本专利技术所采取的技术方案如下:
[0008]一种基于电子病历推断发病时间的方法,包括以下步骤:
[0009]步骤一、通过医院系统获取患者的电子病历;
[0010]步骤二、对电子病历进行处理,将其保存为xml文件,识别获取电子病历中的主诉语段;
[0011]步骤三、利用正则表达式对提取的主诉语段进行解析,识别其中的时间语段;
[0012]步骤四、将识别的时间语段中的数字从汉字转换为阿拉伯数字;
[0013]步骤五、将时间语段转换为小时单位的时间;
[0014]步骤六、获取患者的入院时间,并减去时间段,得到患者发病时间的时间点。
[0015]进一步,所述识别获取电子病历中的主诉语段,具体步骤包括:
[0016]S1、建立集合所有主诉特征词的特征词库;
[0017]S2、获取xml结构的电子病历,利用Xpath技术,生成特征筛选配置文件;
[0018]S3、读取特征筛选配置文件,获取xml结构的电子病历中的待索引元素;
[0019]S4、读取索引生成配置文件,将待处理XML文件中的待索引元素按照所述索引生成配置文件中预设的索引映射关系进行索引,从而获取电子病历中的主诉语段。
[0020]进一步,所述利用正则表达式对提取的主诉语段进行解析,识别其中的时间语段,具体包括以下步骤:
[0021]S1、通过第一正则表达式对主诉语段进行匹配,检索其中包含的与第一正则表达式相同的字符串,从而获取准确时间语段;
[0022]S2、通过第二正则表达式对主诉语段进行匹配,检索其中包含的与第一正则表达式相同的字符串,从而获取模糊时间语段。
[0023]进一步,所述第一正则表达式包含年、月、星期、周、天、日、小时、分钟、秒以及一至十,用于识别包含准确时间的语段。
[0024]进一步,所述第二正则表达式包含近、约、以上、左右、余,用于识别包含模糊时间的语段。
[0025]进一步,所述将识别的时间语段中的数字从汉字转换为阿拉伯数字,具体步骤包括:
[0026]S1、利用正则表达式识别并提取其中一至十的汉字;
[0027]S2、分别识别汉字后分别识别其数字,然后将其替换为对应的阿拉伯数字。
[0028]进一步,所述将时间语段转换为小时单位的时间,具体方法步骤为:
[0029]S1、分别识别时间语段的单位;
[0030]S2、按照1年=8760小时、1月=720小时、1日=24小时的换算,将时间语段依次转换为小时为单位;
[0031]S3、依次将不同时间语段换算的时间相加,从而得到一个时间总数。
[0032]本专利技术与现有技术相比较,具有以下有益效果:
[0033]本专利技术所述一种基于电子病历推断发病时间的方法,通过Xpath技术对患者的主诉进行索引和提取,提取其中与患者发病相关的语段,然后通过正则表达式获取主诉语段中关于时间的语段,再根据时间语段确定患者的发病时间,有助于患者的诊断和治疗。
附图说明
[0034]图1为一种基于电子病历推断发病时间的方法的流程示意图。
[0035]图2为一种基于电子病历推断发病时间的方法中正则表达式的具体表达式。
具体实施方式
[0036]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]如图1

图2所示,本专利技术所述一种基于电子病历推断发病时间的方法,包括以下步骤:
[0038]步骤一、通过医院系统获取患者的电子病历;
[0039]电子病历中包含患者的个人信息、主治医生、主诉信息以及院内相关检查的结果。
[0040]步骤二、对电子病历进行处理,将其保存为xml文件,识别获取电子病历中的主诉语段;
[0041]具体步骤包括:
[0042]S1、建立集合所有主诉特征词的特征词库;
[0043]S2、获取xml结构的电子病历,利用Xpath技术,生成特征筛选配置文件;
[0044]S3、读取特征筛选配置文件,获取xml结构的电子病历中的待索引元素;
[0045]S4、读取索引生成配置文件,将待处理XML文件中的待索引元素按照所述索引生成配置文件中预设的索引映射关系进行索引,从而获取电子病历中的主诉语段。
[0046]步骤三、利用正则表达式对提取的主诉语段进行解析,识别其中的时间语段;
[0047]具体包括以下步骤:
[0048]S1、通过第一正则表达式对主诉语段进行匹配,检索其中包含的与第一正则表达式相同的字符串,从而获取准确时间语段;第一正则表达式包含年、月、星期、周、天、日、小时、分钟、秒以及一至十,用于识别包含准确时间的语段;
[0049]S2、通过第二正则表达式对主诉语段进行匹配,检索其中包含的与第一正则表达式相同的字符串,从而获取模糊时间语段;第二正则表达式包含近、约、以上、左右、余,用于识别包含模糊时间的语段。
[0050]步骤四、将识别的时间语段中的数字从汉字转换为阿拉伯数字;
[0051]具体步骤包括:
[0052]S1、利用正则表达式识别并提取其中一至十的汉字;
[0053]S2、分别识别汉字后分别识别其数字,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于电子病历推断发病时间的方法,其特征在于:包括以下步骤:步骤一、通过医院系统获取患者的电子病历;步骤二、对电子病历进行处理,将其保存为xml文件,识别获取电子病历中的主诉语段;步骤三、利用正则表达式对提取的主诉语段进行解析,识别其中的时间语段;步骤四、将识别的时间语段中的数字从汉字转换为阿拉伯数字;步骤五、将时间语段转换为小时单位的时间;步骤六、获取患者的入院时间,并减去时间段,得到患者发病时间的时间点。2.根据权利要求1所述的一种基于电子病历推断发病时间的方法,其特征在于:所述识别获取电子病历中的主诉语段,具体步骤包括:S1、建立集合所有主诉特征词的特征词库;S2、获取xml结构的电子病历,利用Xpath技术,生成特征筛选配置文件;S3、读取特征筛选配置文件,获取xml结构的电子病历中的待索引元素;S4、读取索引生成配置文件,将待处理XML文件中的待索引元素按照所述索引生成配置文件中预设的索引映射关系进行索引,从而获取电子病历中的主诉语段。3.根据权利要求1所述的一种基于电子病历推断发病时间的方法,其特征在于:所述利用正则表达式对提取的主诉语段进行解析,识别其中的时间语段,具体包括以下步骤:S1、通过第一正则表达式对主诉语段进行匹配,检索其中包...

【专利技术属性】
技术研发人员:黄可智胡江
申请(专利权)人:杭州脉兴医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1