【技术实现步骤摘要】
病历结构化方法、装置及存储介质
[0001]本方法涉及自然语言处理领域,具体是提出了一种病历结构化方法、装置及存储介质,可以实现对医院文本电子病历进行关键词抽取和结构化解析,形成结构化信息表格。
技术介绍
[0002]病历结构化是指将医院产生的患者电子病历(通常为自然语言描述的文本)转换成结构化的形式,从而方便计算机进行统计建模分析,用以支持临床科研、临床辅助决策、病历质控等实际应用。
[0003]病历结构化技术根据实现方式不同可以分为病历前结构化和病历后结构化。病历前结构化是指通过改进电子病历编辑器的交互方式,医生在录入电子病历过程中,在定制的病历模板录入界面下,通过点选、模板定义等输入方式,在录入病历的过程中直接将病历按信息固定结构进行输入和保存。病历前结构化技术是一种传统的结构化技术,由于直接采用了结构化的模板来限制输入内容的顺序和输入范围,生成结构化信息准确率高,但结构化录入能表示的数据维度有限,很多信息类型很难通过点选等交互形式进行录入。此外,预定义的模板数量有限,无法充分覆盖临床不同疾病不同特殊情况的病历 ...
【技术保护点】
【技术特征摘要】
1.一种病历结构化方法,其特征在于,包括以下步骤:将病历模板从根节点开始按照特征描述层级梳理直至叶子节点,从而将所述病历模板转换成树状结构;对所述树状结构列出每个叶子节点直到根节点的父节点路径;根据叶子节点适合填写内容,生成每个叶子节点对应的正则表达式;使用正则表达式遍历实际病历,统计叶子节点对应的正则表达式在整个实际病历中的出现次数,并统计与该正则表达式匹配的匹配结果,若正则表达式的出现次数和匹配结果的数量相同且都为1,则获取匹配结果和位置,将正则表达式与匹配结果保存,否则从所述父节点路径中,结合正则表达式逐级父节点重新组合正则表达式遍历实际病历,直至正则表达式的出现次数以及匹配结果的数量都为1或者0,循环结束。2.根据权利要求1所述的病历结构化方法,其特征在于,所述将正则表达式与匹配结果保存,是指将正则表达式与匹配结果以键值对的形式保存。3.根据权利要求1所述的病历结构化方法,其特征在于,所述将病历模板从根节点开始按照特征描述层级梳理直至叶子节点,将所述病历模板转换成树状结构,包括:将病历模板作为根节点,将病历模板中的标题、固定描述字段或者关键词作为树节点,将症状、结果或非固定描述结果作为叶子节点,按照医学关系理解进行归属组成树状结构。4.根据权利要求1所述的病历结构化方法,其特征在于,所述根据叶子节点适合填写内容,生成每个叶子节点对应的正则表达式,包括:统计叶子节点在采用该病历模板的不同实际病历中的书写内容,确定叶子节点的正则表达式。5.根据权利要求1所述的病历结构化方法,其特征在于,从病历模板的设计文档中获取叶子节点限定的录入选项,作为叶子节点的正则表达式。6.根据权利要求1所述的病历结构化方法,其特征在于,叶子节点与其父节点组合正则表达式符合...
【专利技术属性】
技术研发人员:赵许盼,陶焜,高菲,
申请(专利权)人:北京爱医声科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。