医疗数据抽取方法、装置、存储介质及电子设备制造方法及图纸

技术编号:20847420 阅读:34 留言:0更新日期:2019-04-13 09:15
本公开涉及一种医疗数据抽取方法、医疗数据抽取装置、计算机可读存储介质及电子设备。本公开实施例提供的医疗数据抽取方法包括:建立数据抽取任务并确定文本获取条件;根据所述数据抽取任务获取满足所述文本获取条件的医疗文本;根据所述数据抽取任务确定用于抽取数据的字段模板;使用所述字段模板从所述医疗文本中抽取数据;将抽取到的所述数据关联至对应的数据集合。本公开实施例所提供的医疗数据抽取方法可以适应各种医疗数据结构化项目的数据抽取需求,不仅可以提高了数据抽取效率,而且可以减少人工成本,降低出错率。

【技术实现步骤摘要】
医疗数据抽取方法、装置、存储介质及电子设备
本公开涉及数据处理
,具体涉及一种医疗数据抽取方法、医疗数据抽取装置、计算机可读存储介质及电子设备。
技术介绍
在医疗数据结构化技术中,需要很多训练数据与评估数据。特别是对于处理多医院数据的企业抽取数据到平台进行集中式的训练与测试评估是个比较困难的事情。需要工程师费时费力才能把对应的数据跟对应的结构化项目关联起来,非常繁琐,且重复劳动非常多。而且不同医院的抽取条件不一样,更会导致医学人员与开发人员反复地交互才能抽取到合适的数据。在医疗数据抽取方面主要可以采用以下两种方式:第一种方式是由工程师线下与医学人员确定每个医院抽取的条件,抽取到数据后,工程师再把对应的数据与结构化项目进行关联。在这种方法中,工程师的参入度非常高,数据抽取过程中需要工程师与医学人员针对不同医院反复核对抽取条件。对于抽取到的医疗数据,工程师直接将其与结构化项目相关联,缺乏了医学人员进行二次确认的机制,出错率高,费时费力。另外,不同开发人员的编码习惯以及使用的工具都不一样,没有一个统一的标准,普适性较差。第二种方式是由医学人员通过离线抽数平台抽取对应的数据,然后医学人本文档来自技高网...

【技术保护点】
1.一种医疗数据抽取方法,其特征在于,包括:建立数据抽取任务并确定文本获取条件;根据所述数据抽取任务获取满足所述文本获取条件的医疗文本;根据所述数据抽取任务确定用于抽取数据的字段模板;使用所述字段模板从所述医疗文本中抽取数据。

【技术特征摘要】
1.一种医疗数据抽取方法,其特征在于,包括:建立数据抽取任务并确定文本获取条件;根据所述数据抽取任务获取满足所述文本获取条件的医疗文本;根据所述数据抽取任务确定用于抽取数据的字段模板;使用所述字段模板从所述医疗文本中抽取数据。2.根据权利要求1所述的医疗数据抽取方法,其特征在于,所述建立数据抽取任务并确定文本获取条件包括:确定一个或者多个数据抽取来源;对所述数据抽取来源建立数据抽取任务;根据所述数据抽取任务确定与所述数据抽取来源相关联的文本获取时间;根据所述数据抽取任务确定与所述数据抽取来源无关联的文本获取条件。3.根据权利要求1所述的医疗数据抽取方法,其特征在于,所述文本获取条件包括病人筛选条件和/或病例筛选条件。4.根据权利要求1所述的医疗数据抽取方法,其特征在于,所述根据所述数据抽取任务确定用于抽取数据的字段模板包括:根据所述数据抽取任务确定数据纳入条件;确定与所述数据纳入条件相对应的一个或者多个纳入字段;将所述纳入字段整合形成用于抽取数据的字段模板。5.根据权利要求4所述的医疗数据抽取方法,其特征在于,所述根据所述数据抽取任务确定用于抽取数据的字段模板还包括:根据所述数据抽取任务和所述数据纳...

【专利技术属性】
技术研发人员:滕召荣
申请(专利权)人:金色熊猫有限公司
类型:发明
国别省市:中国香港,81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1