一种基于本体的医学数据整合方法及系统技术方案

技术编号:22166944 阅读:19 留言:0更新日期:2019-09-21 10:35
本发明专利技术提供一种基于本体的医学数据整合方法及系统,其中,所述方法包括:获取多种不同来源的医学研究数据信息;确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。本发明专利技术将不同来源、不同格式的医学研究数据进行标准结构化,有利于不同格式的医学数据之间的查询和利用,更好地实现了不同来源、不同格式的医学研究数据的融合。

An Ontology-based Medical Data Integration Method and System

【技术实现步骤摘要】
一种基于本体的医学数据整合方法及系统
本专利技术涉及医学数据处理
,更具体地,涉及一种基于本体的医学数据整合方法及系统。
技术介绍
对于生物医学研究和药物发现特定领域,生物医学知识和相应的数据庞大,比如,基因组数据、蛋白代谢组数据、菌群数据等相同医学领域的数据,由于医学数据来源不同、医学数据的格式不同,导致这些医学数据之间无法打通实现基于意义的关联,这些医学数据之间很难互相利用,对生物医学领域的研究带来很大的困扰。
技术实现思路
本专利技术提供一种基于本体的医学数据整合方法及系统,克服了不同来源、不同格式的医学数据之间无法融合的问题。根据本专利技术的一个方面,提供了一种基于本体的医学数据整合方法,包括:获取多种不同来源的医学研究数据信息;确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。本专利技术的有益效果为:将不同来源、不同格式的医学数据进行标准结构化,有利于不同格式的医学数据之间的查询和利用,更好地实现了不同来源、不同格式的医学数据的融合。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步的,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库具体包括:根据所述医学研究数据信息的来源,确定该医学研究数据信息所属的医学领域;根据所述医学研究数据信息所属的医学领域,确定所述医学研究数据信息对应的医学本体,进而根据所述医学本体确定对应的结构化模型数据库。进一步的,所述对象类型包含多个关键词字段,所述根据所述医学本体包含的对象类型,对所述医学研究数据信息进行切割具体包括:根据所述对象类型中包含的每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段,所述关键词字段可表征医学研究数据信息片段的含义。进一步的,根据所述对象类型中包含的每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段具体包括:将所述医学研究数据信息与每一个关键词字段进行语义匹配,切割出每一个所述关键词字段对应的医学研究数据信息片段。进一步的,所述将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于所述关系数据库中具体包括:将每一个所述医学研究数据信息片段与所述对象类型包含的关键词字段一一对应输入结构化模型数据库中,从而将所述不同来源的医学研究数据信息转换为标准的结构化模型数据。进一步的,所述将切割后的各段医学研究数据信息输入到所述对象类型的相应位置处,并存储于所述关系数据库中之后还包括:根据关键词字段或者关键词字段组合在所述结构化模型数据库中查询对应的医学研究数据信息片段,并将所述医学研究数据信息片段相关数据以网页形式呈现。根据本专利技术的另一个方面,提供了一种基于本体的医学数据整合系统,包括:获取模块,用于获取多种不同来源的医学研究数据信息;确定模块,基于确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;切割模块,用于按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;存储模块,将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。进一步的,还包括:查询模块,用于根据关键词字段或者关键词字段组合在所述结构化模型数据库中查询对应的医学研究数据信息片段,并将所述医学研究数据信息片段相关数据以网页形式呈现。根据本专利技术的又一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现一种基于本体的医学数据整合方法。附图说明图1为本专利技术一个实施例的一种基于本体的医学数据整合方法流程图;图2为本专利技术另一个实施例的一种基于本体的医学数据整合方法流程图;图3为本专利技术一个实施例的一种基于本体的医学数据整合系统框图;图4为图3中确定模块的内部连接框图;图5为本专利技术另一个实施例的一种基于本体的医学数据整合系统框图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。参见图1,提供了本专利技术一个实施例的一种基于本体的医学数据整合方法,该医学数据整合方法能够将不同来源、不同格式的医学数据进行标准化融合,实现不同医学数据之间的互相使用。该实施例提供的基于本体的医学数据整合方法包括:获取多种不同来源的医学研究数据信息;确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。具体的,医学研究数据信息可来自不同的数据来源,比如,可来自各个不同的医学研究单位,各个基础医学数据库以及不同的研究单位。不同来源的医学研究数据信息,由于所属医学领域不同,医学研究数据信息的格式也存在不同,因此,医学研究数据信息之间很难融合,互相利用。在本实施例中,对于所有的医学研究数据信息,并非只对应一种结构化模型数据库,不同的结构化模型数据库对应有不同的标准,因此,需要先确定医学研究数据信息对应哪一种结构化模型数据库。不同的结构化模型数据库对应不同的医学本体,所谓医学本体,可以理解为制定的一套规则、概念描述,根据这一套规则、概念描述,将医学研究数据信息进行标准结构化。当确定了医学研究数据信息对应的医学本体后,即可确定该医学研究数据信息对应的结构化模型数据库。所谓医学本体,其中包含对象类型,对象类型中可能包含多个概念描述字段,对医学研究数据信息进行切割,将医学研究数据信息切割为多个医学研究数据信息片段,每一个医学研究数据信息片段与对象类型中的概念描述字段进行对应。对医学研究数据信息进行切割后,将切割后的医学研究数据信息片段与对应的对象类型相应存储在结构化模型数据库中,即形成了标准化的数据库。对于同一结构化模型数据库中的医学研究数据信息,是可以互相融合利用的。在本专利技术的一个实施例中,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库具体包括:根据所述医学研究数据信息的来源,确定该医学研究数据信息所属的医学领域;根据所述医学研究数据信息所属的医学领域,确定所述医学研究数据信息对应的医学本体,进而根据所述医学本体确定对应的结构化模型数据库。具体的,在本专利技术实施例中,不同的医学领域对应不同的医学本体,以及不同的医学本体对应不同的结构化模型数据库。因此,对于不同来源的医学研究数据信息,首先需要确定医学研究数据信息所属的医学领域。通常,原始的医学研究数据信息的来源地通常会表征该医学研究数据信息所属的医学领域,比如,存储原始医学研究数据信息的基础医学数据库的命名规则会表征该医学研究数据信息所属的医学领域,在这种情况下,可以根据基础医学数据库的命名来确定其中存储的医学研究数据信息的医学领域,而后根据医学领域确定对应的医学本体,进而根据确定的医学本体进一步确定该医学研究数据信息对应的结构化模型数据库,每一个结构化本文档来自技高网...

【技术保护点】
1.一种基于本体的医学数据整合方法,其特征在于,包括:获取多种不同来源的医学研究数据信息;确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。

【技术特征摘要】
1.一种基于本体的医学数据整合方法,其特征在于,包括:获取多种不同来源的医学研究数据信息;确定所述医学研究数据信息的医学本体,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库;按照所述医学本体包含的对象类型,对所述医学研究数据信息进行切割,形成医学研究数据信息片段;将所述医学研究数据信息片段输入到所述对象类型的相应位置处,并存储于结构化模型数据库中。2.根据权利要求1所述的医学数据整合方法,其特征在于,根据医学本体确定所述医学研究数据信息对应的结构化模型数据库具体包括:根据所述医学研究数据信息的来源,确定该医学研究数据信息所属的医学领域;根据所述医学研究数据信息所属的医学领域,确定所述医学研究数据信息对应的医学本体,进而根据所述医学本体确定对应的结构化模型数据库。3.根据权利要求1所述的医学数据整合方法,其特征在于,所述对象类型包含多个关键词字段,所述根据所述医学本体包含的对象类型,对所述医学研究数据信息进行切割具体包括:根据所述对象类型中包含的每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段,所述关键词字段可表征医学研究数据信息片段的含义。4.根据权利要求3所述的医学数据整合方法,其特征在于,根据所述对象类型中包含的每一个关键词字段,将所述医学研究数据信息切割为多个医学研究数据信息片段具体包括:将所述医学研究数据信息与每一个关键词字段进行语义匹配,切割出每一个所述关键词字段对应的医学研究数据信息片段。5.根据权利要求4所述的医学数据整合方法,其特...

【专利技术属性】
技术研发人员:郑捷
申请(专利权)人:武汉维特鲁威生物科技有限公司
类型:发明
国别省市:湖北,42

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1