一种医疗数据的结构化方法、装置、设备及存储介质制造方法及图纸

技术编号:24251450 阅读:38 留言:0更新日期:2020-05-22 23:31
本申请提供了一种医疗数据的结构化方法、装置、设备及存储介质,所述方法包括:获取待结构化的医疗数据;根据所述待结构化的医疗数据、预设的关键实体和关键实体关系,生成以所述关键实体的个数为维度数的实体向量,以对所述待结构化的医疗数据进行结构化;其中,所述实体向量的每个维度分别与不同的关键实体具有对应关系。本申请基于预设的关键实体和关键实体关系在待结构化的医疗数据中的出现情况,生成待结构化的医疗数据对应的实体向量,实现医疗数据的结构化,能够满足各个行业对医疗数据的应用需求。

A structured method, device, device and storage medium of medical data

【技术实现步骤摘要】
一种医疗数据的结构化方法、装置、设备及存储介质
本专利技术属于数据处理
,尤其涉及一种医疗数据的结构化方法、装置、设备及存储介质。
技术介绍
随着互联网技术的不断发展以及医疗行业信息化水平的不断提高,医疗大数据的价值体现越来越明显,医疗大数据能够为医疗、制药、保险和研究等提供大量有用信息。然而大量的传统医疗信息都是以病历文本形式存在的,想要有效的利用这些以病历文本形式存在的医疗数据,就需要根据具体需求对病历文本形式的医疗数据进行结构化处理。目前,如何更好的实现医疗数据的结构化是医疗领域不断探索的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种医疗数据的结构化方法、装置、设备及存储介质,能够实现医疗数据的结构化,更好的满足各个行业对医疗数据的应用需求。第一方面,本申请提供了一种医疗数据的结构化方法,所述方法包括:获取待结构化的医疗数据;根据所述待结构化的医疗数据、预设的关键实体和关键实体关系,生成以所述关键实体的个数为维度数的实体向量,以对所述待结构化的医疗数据进行结构化;其中,所述实体向量的每个维度分别与不同的关键实体具有对应关系。第二方面,本申请提供了一种医疗数据的结构化装置,该装置包括:获取模块,用于获取待结构化的医疗数据;生成模块,用于根据所述待结构化的医疗数据、预设的关键实体和关键实体关系,生成以所述关键实体的个数为维度数的实体向量,以对所述待结构化的医疗数据进行结构化;其中,所述实体向量的每个维度分别与不同的关键实体具有对应关系。第三方面,本申请还提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一项所述的方法。第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项所述的方法。本专利技术实施例与现有技术相比存在的有益效果至少在于:本申请提供的医疗数据的结构化方法中,基于预设的关键实体和关键实体关系在待结构化的医疗数据中的出现情况,生成待结构化的医疗数据对应的实体向量,实现医疗数据的结构化,能够满足各个行业对医疗数据的应用需求。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请实施例提供的一种医疗数据的结构化方法的流程图;图2为本申请实施例提供的一种样本数据的获取方法的流程图;图3为本申请实施例提供的一种医疗数据的结构化装置的结构示意图;图4是本申请实施例提供的一种医疗数据的结构化设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了实现医疗数据的结构化,本申请提供了一种医疗数据的结构化方法,具体的,首先,获取待结构化的医疗数据;然后,根据待结构化的医疗数据、预设的关键实体和关键实体关系,生成以关键实体的个数为维度数的实体向量,以对待结构化的医疗数据进行结构化;其中,实体向量的每个维度分别与不同的关键实体具有对应关系。通过上述结构化处理,使得医疗数据能够被应用于各个行业。以下为本申请实施例提供的一种医疗数据的结构化方法,其中,本申请实施例提供的医疗数据的结构化方法可以应用于各种终端,如台式电脑、手机、笔记本电脑、其他智能终端等。参考图1,为本申请实施例提供的一种医疗数据的结构化方法的流程图。该方法具体包括:S101:获取待结构化的医疗数据。本申请实施例中,待结构化的医疗数据可以为以病历文本形式存在的医疗数据。以如下的以病历文本形式存在的医疗数据1作为待结构化的医疗数据为例,包括:入室,全麻后,取仰卧位,常规消毒,铺单。经口置支撑喉镜,沿舌背正中送入,越过舌根,挑起会厌,连接支架,暴露会厌,查见会厌舌面有乳头状新生物,大小约1.0*0.6*0.6cm,表浅,广基,分次钳除尽新生物,棉球压迫止血,查无病变残留,无活动性出血。退出喉镜。术毕。标本留送病检。手术顺利,麻醉满意,术中出血少,病人**后安返病房。S102:根据所述待结构化的医疗数据、预设的关键实体和关键实体关系,生成以所述关键实体的个数为维度数的实体向量,以对所述待结构化的医疗数据进行结构化;其中,所述实体向量的每个维度分别与不同的关键实体具有对应关系。本申请实施例中,可以根据对医疗数据的应用需求,预先设置关键实体。其中,关键实体是指与应用需求强相关的名词。例如,假设对医疗数据的应用需求为向癌症研究提供病历文本的样本,则可以将关键实体设置为癌症、化疗、手术等与应用需求强相关的名词。另外,也可以通过遍历医疗数据的方式设置满足应用需求的关键实体。具体的,本申请实施例对于设置关键实体的方法不做限定。以上述医疗数据1为例,假设对医疗数据1的应用需求为某种疾病方向的医学研究,则可以为上述医疗数据1设置关键实体为:“支撑喉镜”、“会厌”、“新生物”、“钳除”和“病检”等与医学研究方向相关的医学名词。另外,本申请实施例在设置关键实体之后,基于关键实体预先设置关键实体关系。其中,关键实体关系用于表示任意两个或多个关键实体具有特定关系。实际应用中,可以将医疗数据中属于同一个句子的关键实体确定为关键实体关系,或者可以将医疗数据中属于同一个段落的关键实体确定为关键实体关系。具体的,本申请实施例对于设置关键实体关系的方法不做限制。以上述医疗数据1为例,可以将上述医疗数据1中的“支撑喉镜”和“新生物”两个关键实体确定为一个关键实体关系。本申请实施例中,在确定关键实体之后,为了实现对医疗数据的结构化,可以基于关键实体,生成以关键实体的个数为维度数的实体向量,用于表示对应的医疗数据,实现对该医疗数据的结构化。具体的,生成的实体向量的每个维度分别与不同的关键实体具有对应关系。以上述医疗数据1为例,由于预设的关键实体包括:“支撑喉镜”、“会厌”、“新生物”、“钳除”和“病检”,共5个医学名词,因此,可以为上述医疗数据1建立一个5维向量,初始值为[0,0,0,0,0]。其中,5维向量的每个维度分别与“支撑喉镜”、“会厌”、“新生物”、“钳除”和“病检”具有对应关系。实际应用中,实体向量中每个维度的数值是根据待结构化的医疗数据中关键实体和关键实体关系的出现情况生成。一种可选的实施方式中,首先,识别待结构化的医疗数据中的关键实体,并统计各个关键实体在本文档来自技高网...

【技术保护点】
1.一种医疗数据的结构化方法,其特征在于,该方法包括:/n获取待结构化的医疗数据;/n根据所述待结构化的医疗数据、预设的关键实体和关键实体关系,生成以所述关键实体的个数为维度数的实体向量,以对所述待结构化的医疗数据进行结构化;其中,所述实体向量的每个维度分别与不同的关键实体具有对应关系。/n

【技术特征摘要】
1.一种医疗数据的结构化方法,其特征在于,该方法包括:
获取待结构化的医疗数据;
根据所述待结构化的医疗数据、预设的关键实体和关键实体关系,生成以所述关键实体的个数为维度数的实体向量,以对所述待结构化的医疗数据进行结构化;其中,所述实体向量的每个维度分别与不同的关键实体具有对应关系。


2.根据权利要求1所述的方法,其特征在于,所述根据所述待结构化的医疗数据、预设的关键实体和关键实体关系,生成以所述关键实体的个数为维度数的实体向量,包括:
识别所述待结构化的医疗数据中的所述关键实体,并统计各个关键实体在所述待结构化的医疗数据中的出现次数;
识别所述待结构化的医疗数据中是否存在预设至少两个关键实体的关键实体关系,并得到各个关键实体关系的识别结果;
基于各个关键实体在所述待结构化的医疗数据中的出现次数,以及各个关键实体关系的识别结果,生成所述待结构化的医疗数据对应的实体向量中各个维度的数值。


3.根据权利要求2所述的方法,其特征在于,所述基于各个关键实体在所述待结构化的医疗数据中的出现次数,以及各个关键实体关系的识别结果,生成所述实体向量中各个维度的数值,包括:
利用各个关键实体在所述待结构化的医疗数据中的出现次数,生成所述实体向量中对应维度的数值;
将识别结果为存在于所述待结构化的医疗数据中的关键实体关系包括的关键实体,在所述实体向量中对应维度的数值乘以预设倍数,以更新所述实体向量中对应维度的数值。


4.根据权利要求3所述的方法,其特征在于,所述利用各个关键实体在所述待结构化的医疗数据中的出现次数,生成所述实体向量中对应维度的数值,包括:
利用各个关键实体在所述待结构化的医疗数据中的出现次数与所属优先等级对应的权值之间的乘积,更新所述实体向量中对应维度的数值。


5.根据权利要求1所述的方法,其特征在于,所述对所述待结构化的医疗数据进行结构化之后,该方法还包括:

【专利技术属性】
技术研发人员:侯婧刘水清
申请(专利权)人:南京医睿科技有限公司南京懿医云大数据科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1