【技术实现步骤摘要】
一种中文临床病历中有效症状实体提取方法
[0001]本专利技术主要涉及到医疗信息化
,特指一种中文临床病历中有效症状实体提取方法。
技术介绍
[0002]一份详尽的临床病历通常包含病患病史特点、身体状况、检查结果、诊断结论、用药建议以及治疗方式等信息,其中患者当前的身体状态(症状),是医生进行临床诊断的重要依据,也是医疗分析软件的重要输入,因此高效准确的从临床病历中提取出症状信息意义重大。中文临床病历的特点有:(1)篇幅较长;(2)不同地区、机构的病历组织结构各异,表达方式也不尽相同;(3)充斥着大量的否定用语;(4)症状表述各异。中文病历的上述特点导致人工从病历中提取症状较为困难,特别的,由于临床病历中大量否定域的存在(例:无呕吐、头晕),人工提取时需要对这些否定域进行剔除,费时费力。此外,如果要将提取结果(症状)用于其他分析软件,则还需将提取结果转化为标准的表型术语(HPO),要求医务人员对标准表型术语有充分的理解。
技术实现思路
[0003]本专利技术要解决的技术问题就在于:针对现有技术存在的技术 ...
【技术保护点】
【技术特征摘要】
1.一种中文临床病历中有效症状实体提取方法,其特征在于,包括:否定域剔除,对临床病历中描述病患没有哪些症状的语句进行剔除;症状类实体提取,利用神经网络的方法进行症状类实体的自动提取,得到实体词;实体组合与标准化,将上述得到的实体词通过组合后成为一个完整的症状表述,将完整的症状表述与标准表型术语相关联。2.根据权利要求1所述的中文临床病历中有效症状实体提取方法,其特征在于,在进行否定域剔除过程中,使用黑名单正则式和白名单正则式组合来完成否定域的识别与剔除操作。3.根据权利要求2所述的中文临床病历中有效症状实体提取方法,其特征在于,所述黑名单正则式和白名单正则式的内容是根据临床病历的常见用语来整理并建库,并通过机器学习的方式不断训练计算机来实现数据库的更新和完善。4.根据权利要求1
‑
3中任意一项所述的中文临床病历中有效症状实体提取方法,其特征在于,在进行症状类实体提取过程中,将临床病历中的症状类实体分为形容词ADJ、部位BODY以及表征SYM三个细分种类,一个完整的症状类实体由表证词加上形容词ADJ、部位BODY组成。5.根据权利要求4所述的中文临床病历中有效症状实体提取方法,其特征在于,在进行症状类实体提取过程中,使用词嵌入方法将临床病历文本向量化为输入特征,利用训练好的神经网络模型,对输入特征的类型判断,并将识别结果输出,实现症状类实体的自动提取。6.根据权利要求4所述的中文临床病历中有效症状实体提取方法,其特征在于,所述症状类实体提取过程的流程包括:步骤S10:模型选择;采用双向长短时记忆网络
‑
条件随机场模型结构;步骤S20:...
【专利技术属性】
技术研发人员:张少伟,蒋艳凰,余硕军,彭厘旻,康佳琪,万斌,雷鹏,孙朝晖,
申请(专利权)人:人和未来生物科技长沙有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。