医疗信息中数据的抽取方法、装置、设备和存储介质制造方法及图纸

技术编号:32239097 阅读:12 留言:0更新日期:2022-02-09 17:43
本说明书实施方式提供了一种医疗信息中数据的抽取方法以及装置、设备和存储介质。包括:确定所述医疗信息的定位词;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集;其中,所述相邻词汇集包括所述医疗信息中与所述定位词处于设定距离内的词汇。使用针对所述定位词预配置的数据抽取规则,在所述相邻词汇集中抽取与所述定位词具有指定依附关系的目标数据。通过使用定位词和定位词预配置的数据抽取规则,定位和抽取目标数据,以实现对不同医疗数据中指定数据进行抽取。取。取。

【技术实现步骤摘要】
医疗信息中数据的抽取方法、装置、设备和存储介质


[0001]本说明书涉及计算机数据处理的
,具体涉及一种医疗信息中数据的抽取方法、装置、设备和存储介质。

技术介绍

[0002]随着信息技术的不断发展,医疗信息化过程也不断被推进,产生了大量的医疗数据。其中,医疗数据包含大量的病人、药物以及手术等关键信息,对疾病的诊断、治疗都有着较大的作用。然而,现有技术中,不同的医疗数据有着较大差异,通常只能通过人工提取医疗信息中的数据,费时费力。

技术实现思路

[0003]有鉴于此,本说明书多个实施方式致力于提供一种医疗信息中数据的抽取方法、装置、计算机设备和存储介质,以提供一种能对不同医疗数据中指定数据进行抽取的方法。
[0004]本说明书实施方式提出了一种医疗信息中数据的抽取方法,包括:确定所述医疗信息的定位词;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集;其中,所述相邻词汇集包括所述医疗信息中与所述定位词处于设定距离内的词汇;使用针对所述定位词预配置的数据抽取规则,在所述相邻词汇集中抽取与所述定位词具有指定依附关系的目标数据。
[0005]本说明书实施方式提出了一种医疗信息中数据的抽取装置,包括:定位词确定模块,用于确定所述医疗信息的定位词;相邻词汇集生成模块,用于基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集;其中,所述相邻词汇集包括所述医疗信息中与所述定位词处于设定距离内的词汇;数据抽取模块,用于在所述相邻词汇集中抽取与所述定位词具有指定依附关系的目标数据。
[0006]本说明书实施方式提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述实施方式所述的方法。
[0007]本说明书实施方式提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述实施方式所述的方法。
[0008]本说明书实施方式通过使用定位词和定位词预配置的数据抽取规则,定位和抽取目标数据,以实现对不同医疗数据中指定数据进行抽取。
附图说明
[0009]图1所示为一实施方式提供的一个场景示例中不同端交互的示意图。
[0010]图2所示为一实施方式提供的一个场景示例中不同端交互的示意图。
[0011]图3所示为一实施方式提供的医疗信息中数据的抽取方法的流程示意图。
[0012]图4所示为一实施方式提供的医疗信息中数据的抽取方法的流程示意图。
[0013]图5所示为一实施方式提供的医疗信息中数据的抽取装置示意图。
具体实施方式
[0014]为了使本
的人员更好地理解本说明书方案,下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本说明书保护的范围。
[0015]请参阅图1和图2。本说明书提供一个医疗信息数据的抽取系统的场景示例,所述医疗信息数据的抽取系统可以包括客户端和服务器。用户可能是医疗领域的工作者,需要在医疗信息数据库中抽取目标数据。在一次医疗信息的数据抽取的事件中,用户可能会希望在电子病例中,抽取药物的服用方式、服用剂量和服用时间的信息。
[0016]用户首先会向客户端输入需要抽取对象。针对需要抽取药物的服用方式、服用剂量和服用时间的抽取事件,用户可以在客户端中,确定目标数据的类型为药物、服用方式、服用剂量和服用时间。接着客户端会将目标数据类型发送给服务器并请求返回目标数据。服务器在收到目标数据类型,会从数据库中提取出电子病例数据,接着通过所述目标数据的类型中的核心目标数据的类型——药物,确定并提取出电子病例中与药物对应的记录处方信息的文本数据。
[0017]获取到所述文本数据后,服务器会从规则库中调用预先配置的用于抽取药物信息的数据抽取规则,先对所述文本数据进行分词、清洗、标准化等预处理操作。随后,服务器会根据所述抽取药物信息的数据抽取规则中指定的命名实体识别方法,依次识别所述文本数据中每个段落的实体词和对应的实体类型。当段落中的不存在类型为药物的实体词时,服务器可以从内存中删除对应的段落。
[0018]当确定类型为药物的实体词之后,服务器便会将所述实体词作为锚点词。在对应段落中提取与所述锚点词在设定距离之内的词汇构成相邻词汇集。其中,所述相邻词汇集还记录了词汇的在所述文本数据中的顺序。接着,服务器会调用药物的服用方式、服用剂量和服用时间对应的数据抽取规则。使用所述数据抽取规则,在所述相邻词汇集中分别提取服用方式、服用剂量和服用时间。对于在文本数据中抽取药物的服用方式、服用剂量和服用时间的数据抽取规则,可以是先分析相邻词汇集中是否存在否定词。当所述相邻词汇集中不存在否定词或者存在偶数个否定词时,再通过用于抽取药物属性的实体识别方法和句法分析方法抽取药物的服用方式、服用剂量和服用时间。当相邻词汇集中存在至少一个需要抽取对象的情况,服务器便会将对应的数据返回给客户端。客户端在接受到目标数据后则会通过显示器将目标数据呈现给用户。
[0019]以上所述仅为本说明书提供的一个场景示例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换等,均应包含在本专利技术的保护范围之内。
[0020]本说明书实施方式提供一种医疗信息数据的抽取系统。所述医疗信息数据的抽取系统可以包括客户端和服务器。所述客户端可以是具有网络访问能力的电子设备。具体的,例如,客户端可以是台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、导购终端、电视机、智能音箱、麦克风等。其中,智能可穿戴设备包括但不限于智能手环、智能手表、智能眼镜、智能头盔、智能项链等。或者,客户端也可以为能够运行于所述电子设
备中的软件。服务器可以是具有一定运算处理能力的电子设备。其可以具有网络通信模块、处理器和存储器等。当然,所述服务器也可以是指运行于所述电子设备中的软体。所述服务器还可以为分布式服务器,可以是具有多个处理器、存储器、网络通信模块等协同运作的系统。或者,服务器还可以为若干服务器形成的服务器集群。或者,随着科学技术的发展,服务器还可以是能够实现说明书实施方式相应功能的新的技术手段。例如,可以是基于量子计算实现的新形态的“服务器”。
[0021]请参阅图3,本说明书实施方式提供一种医疗信息中数据的抽取方法,所述方法包括以下步骤。
[0022]步骤S110:确定所述医疗信息的定位词。
[0023]医疗信息的数据量较大,且种类繁多,直接对所述医疗信息抽取目标数据,计算量较大,需要耗费较长的时间。因此可以先基于目标数据确定定位词,通过定位词确定信息子集进一步抽取。
[0024]所述医疗信息为医疗领域的数据。具体的,例如,医疗信息可以是医疗领域的电子病例,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗信息中数据的抽取方法,其特征在于,包括:确定所述医疗信息的定位词;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集;其中,所述相邻词汇集包括所述医疗信息中与所述定位词处于设定距离内的词汇;使用针对所述定位词预配置的数据抽取规则,在所述相邻词汇集中抽取与所述定位词具有指定依附关系的目标数据。2.根据权利要求1所述的方法,其特征在于,确定所述医疗信息的定位词的步骤,包括:设定所述定位词所属的目标医学术语类型;其中,医学术语类型包括依照词汇表达的医学事项划分;在所述医疗信息中匹配属于所述目标医学术语类型的词汇,作为所述定位词。3.根据权利要求2所述的方法,其特征在于,所述医学术语类型包括药品术语类型、医疗器械术语类型、医疗手术类型、检验术语类型、医学影像术语类型或疾病术语类型。4.根据权利要求2所述的方法,其特征在于,所述医疗信息依照临床业务划分多个信息子集;其中,信息子集包括至少一个信息片段;所述方法还包括:依照所述目标医学术语类型,在所述多个信息子集中确定目标信息子集;相应的,在所述医疗信息中匹配属于所述目标医学术语类型的词汇,作为所述定位词的步骤,包括:在所述目标信息子集的信息片段中匹配所述目标医学术语类型的词汇,作为所述定位词。5.根据权利要求1所述的方法,其特征在于,所述医疗信息包括多个信息片段;所述方法还包括:去除所述医疗信息中,不涉及所述定位词的信息片段。6.根据权利要求1所述的方法,其特征在于,所述医疗信息包括多个信息片段;基于所述定位词在所述医疗信息中的位置,生成与所述定位词对应的相邻词汇集的步骤,包括:获取所述定位词在相应的信息片段中的位置索引;其中,所述位置索引用于表示所述定位词在所述信息片段中的相对位置;在所述信息片段中,提取与所述位置索引处于所述设定距离内的词汇,得到所述相邻词汇集。7.根据权利要求1所述的方法,其特征在于,与所述定位词处于所述设定距离内的医疗信息形成词汇提...

【专利技术属性】
技术研发人员:王永明张凯赵周剑吴大帅
申请(专利权)人:浙江太美医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1