医疗信息中数据的抽取方法、装置、设备和存储介质制造方法及图纸

技术编号:32239097 阅读:25 留言:0更新日期:2022-02-09 17:43
本说明书实施方式提供了一种医疗信息中数据的抽取方法以及装置、设备和存储介质。包括:确定所述医疗信息的定位词;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集;其中,所述相邻词汇集包括所述医疗信息中与所述定位词处于设定距离内的词汇。使用针对所述定位词预配置的数据抽取规则,在所述相邻词汇集中抽取与所述定位词具有指定依附关系的目标数据。通过使用定位词和定位词预配置的数据抽取规则,定位和抽取目标数据,以实现对不同医疗数据中指定数据进行抽取。取。取。

【技术实现步骤摘要】
医疗信息中数据的抽取方法、装置、设备和存储介质


[0001]本说明书涉及计算机数据处理的
,具体涉及一种医疗信息中数据的抽取方法、装置、设备和存储介质。

技术介绍

[0002]随着信息技术的不断发展,医疗信息化过程也不断被推进,产生了大量的医疗数据。其中,医疗数据包含大量的病人、药物以及手术等关键信息,对疾病的诊断、治疗都有着较大的作用。然而,现有技术中,不同的医疗数据有着较大差异,通常只能通过人工提取医疗信息中的数据,费时费力。

技术实现思路

[0003]有鉴于此,本说明书多个实施方式致力于提供一种医疗信息中数据的抽取方法、装置、计算机设备和存储介质,以提供一种能对不同医疗数据中指定数据进行抽取的方法。
[0004]本说明书实施方式提出了一种医疗信息中数据的抽取方法,包括:确定所述医疗信息的定位词;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集;其中,所述相邻词汇集包括所述医疗信息中与所述定位词处于设定距离内的词汇;使用针对所述定位词预配置的数据抽取规则,在所述相邻词汇集中抽取与所述定位词本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种医疗信息中数据的抽取方法,其特征在于,包括:确定所述医疗信息的定位词;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集;其中,所述相邻词汇集包括所述医疗信息中与所述定位词处于设定距离内的词汇;使用针对所述定位词预配置的数据抽取规则,在所述相邻词汇集中抽取与所述定位词具有指定依附关系的目标数据。2.根据权利要求1所述的方法,其特征在于,确定所述医疗信息的定位词的步骤,包括:设定所述定位词所属的目标医学术语类型;其中,医学术语类型包括依照词汇表达的医学事项划分;在所述医疗信息中匹配属于所述目标医学术语类型的词汇,作为所述定位词。3.根据权利要求2所述的方法,其特征在于,所述医学术语类型包括药品术语类型、医疗器械术语类型、医疗手术类型、检验术语类型、医学影像术语类型或疾病术语类型。4.根据权利要求2所述的方法,其特征在于,所述医疗信息依照临床业务划分多个信息子集;其中,信息子集包括至少一个信息片段;所述方法还包括:依照所述目标医学术语类型,在所述多个信息子集中确定目标信息子集;相应的,在所述医疗信息中匹配属于所述目标医学术语类型的词汇,作为所述定位词的步骤,包括:在所述目标信息子集的信息片段中匹配所述目标医学术语类型的词汇,作为所述定位词。5.根据权利要求1所述的方法,其特征在于,所述医疗信息包括多个信息片段;所述方法还包括:去除所述医疗信息中,不涉及所述定位词的信息片段。6.根据权利要求1所述的方法,其特征在于,所述医疗信息包括多个信息片段;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集的步骤,包括:获取所述定位词在相应的信息片段中的位置索引;其中,所述位置索引用于表示所述定位词在所述信息片段中的相对位置;在所述信息片段中,提取与所述位置索引处于所述设定距离内的词汇,得到所述相邻词汇集。7.根据权利要求1所述的方法,其特征在于,与所述定位词处于所述设定距离内的医疗信息形成词汇提...

【专利技术属性】
技术研发人员:王永明张凯赵周剑吴大帅
申请(专利权)人:浙江太美医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1