图谱构建和检索方法、装置、电子设备和存储介质制造方法及图纸

技术编号:38905717 阅读:14 留言:0更新日期:2023-09-22 14:24
本发明专利技术提供一种图谱构建和检索方法、装置、电子设备和存储介质,其中方法包括:基于医学研究文献,构建以疾病为单位的疾病信号通路图谱;基于各疾病的疾病信号通路图谱中相同的分子实体,对所述各疾病的疾病信号通路图谱进行关联,得到疾病间关系图谱;基于所述疾病间关系图谱中的疾病实体与靶点实体之间的关系,以及预先确定的药物与靶点之间的关系,构建药物

【技术实现步骤摘要】
图谱构建和检索方法、装置、电子设备和存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种图谱构建和检索方法、装置、电子设备和存储介质。

技术介绍

[0002]随着药品研发市场的迅速发展,新药研发的竞争日渐激烈。创新药和仿制药的研发都面临着大量的挑战性,需要经历长期的研发过程,投入大量的研发成本和人力物力,才能够面市。相较于创新药研发和仿制药研发,挖掘药品新的适应症的研发是一种风险较低、获益较大的选择。与创新药和仿制药研发不同,挖掘药品新的适应症不需要从头开始研发,也不需要花费巨额的研发费用,因此风险较低。
[0003]目前,由于药品的研发信息分散于海量的医学文献中,针对药品新的适应症信息的挖掘大多是通过人工整理实现的,即从海量文献数据中收集各种药品的研发信息,并对其进行筛选、整理和归类,此种方式不仅费事费力,效率低下,而且受限于数据完整性或个人认知,导致药品信息挖掘的可靠性和准确性较差。

技术实现思路

[0004]本专利技术提供一种图谱构建和检索方法、装置、电子设备和存储介质,用以解决现有技术中药品信息挖掘效率低、可靠性和准确性较差的缺陷。
[0005]本专利技术提供一种图谱构建方法,包括:
[0006]基于医学研究文献,构建以疾病为单位的疾病信号通路图谱;
[0007]基于各疾病的疾病信号通路图谱中相同的分子实体,对所述各疾病的疾病信号通路图谱进行关联,得到疾病间关系图谱,所述分子实体为生物标志物实体和/或靶点实体;
[0008]基于所述疾病间关系图谱中的疾病实体与靶点实体之间的关系,以及预先确定的药物与靶点之间的关系,构建药物

疾病关系图谱。
[0009]根据本专利技术提供的一种图谱构建方法,所述疾病间关系图谱中的疾病实体与靶点实体之间的关系的确定步骤,包括:
[0010]获取所述疾病间关系图谱中用于连接各疾病实体与各靶点实体的信号通路;
[0011]基于所述信号通路中各节点之间的关系,确定所述信号通路所对应的疾病实体与靶点实体之间的关系。
[0012]根据本专利技术提供的一种图谱构建方法,所述基于所述信号通路中各节点之间的关系,确定所述信号通路所对应的疾病实体与靶点实体之间的关系,包括:
[0013]统计所述信号通路中节点之间的关系为负向调节的关系数量;
[0014]基于所述关系数量,确定所述信号通路所对应的疾病实体与靶点实体之间的关系为正向调节关系或负向调节关系。
[0015]根据本专利技术提供的一种图谱构建方法,所述疾病间关系图谱中的疾病实体与靶点实体之间的关系的确定步骤,还包括:
[0016]若所述信号通路存在于所述疾病信号通路图谱中,则确定所述信号通路所对应的疾病实体与靶点实体之间的关系为实际关联关系;
[0017]否则,确定所述信号通路所对应的疾病实体与靶点实体之间的关系为潜在关联关系。
[0018]根据本专利技术提供的一种图谱构建方法,所述基于医学研究文献,构建以疾病为单位的疾病信号通路图谱,包括:
[0019]对所述医学研究文献中的语句进行实体识别,得到所述医学研究文献所包含的实体对,所述实体对包括实体以及所述实体之间的实体关系;
[0020]基于所述实体和所述实体关系,构建所述以疾病为单位的疾病信号通路图谱。
[0021]根据本专利技术提供的一种图谱构建方法,所述对所述医学研究文献中的语句进行实体识别,得到所述医学研究文献所包含的实体对,包括:
[0022]获取所述医学研究文献的标题文本和摘要文本;
[0023]将所述标题文本和摘要文本输入至语句分类器,得到所述语句分类器输出的所述标题文本和摘要文本中各语句的语句类型;
[0024]对所述语句类型为待识别的语句进行实体识别,得到所述医学研究文献所包含的实体对。
[0025]根据本专利技术提供的一种图谱构建方法,所述进行实体识别,得到所述医学研究文献所包含的实体对,包括:
[0026]对所述语句进行实体识别,得到所述语句中的实体和代词;
[0027]将所述实体和所述代词输入至指代关系分类器,得到所述指代关系分类器输出的所述实体与所述代词之间的指代关系;
[0028]在所述指代关系为是的情况下,将所述语句中的代词替换为对应实体,得到优化语句;
[0029]将所述优化语句,以及所述优化语句中的实体输入实体关系分类器,得到所述实体关系分类器输出的所述实体之间的实体关系。
[0030]本专利技术还提供一种检索方法,包括:
[0031]获取待查询的目标实体;
[0032]基于药物

疾病关系图谱,确定所述目标实体的相关知识信息,所述药物

疾病关系图谱是基于如上述任一种所述的图谱构建方法确定的。
[0033]本专利技术还提供一种图谱构建装置,包括:
[0034]初始图谱构建单元,用于基于医学研究文献,构建以疾病为单位的疾病信号通路图谱;
[0035]图谱关联单元,用于基于各疾病的疾病信号通路图谱中相同的分子实体,对所述各疾病的疾病信号通路图谱进行关联,得到疾病间关系图谱,所述分子实体为生物标志物实体和/或靶点实体;
[0036]目标图谱构建单元,用于基于所述疾病间关系图谱中的疾病实体与靶点实体之间的关系,以及预先确定的药物与靶点之间的关系,构建药物

疾病关系图谱。
[0037]本专利技术还提供一种检索装置,包括:
[0038]获取单元,用于获取待查询的目标实体;
[0039]检索单元,用于基于药物

疾病关系图谱,确定所述目标实体的相关知识信息,所述药物

疾病关系图谱是基于如上述任一种所述的图谱构建方法确定的。
[0040]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述图谱构建方法或检索方法。
[0041]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述图谱构建方法或检索方法。
[0042]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述图谱构建方法或检索方法。
[0043]本专利技术提供的一种图谱构建和检索方法、装置、电子设备和存储介质,通过基于医学研究文献,构建以疾病为单位的疾病信号通路图谱,可以使得海量医学研究文献中的信息能够被全面、准确地提炼到各疾病的疾病信号通路图谱中,从而提高信息挖掘、提炼的效率,通过对各疾病的疾病信号通路图谱进行关联,可以挖掘出疾病和靶点的潜在关联关系,进而基于预先确定的药物与靶点之间的关系,进一步挖掘出药物与疾病潜在的关联关系,由此构建得到的药物

疾病关系图谱,可以帮助用户高效、准确地挖掘出药品新的适应症,从而提高药品信息挖掘的效率、可靠性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图谱构建方法,其特征在于,包括:基于医学研究文献,构建以疾病为单位的疾病信号通路图谱;基于各疾病的疾病信号通路图谱中相同的分子实体,对所述各疾病的疾病信号通路图谱进行关联,得到疾病间关系图谱,所述分子实体为生物标志物实体和/或靶点实体;基于所述疾病间关系图谱中的疾病实体与靶点实体之间的关系,以及预先确定的药物与靶点之间的关系,构建药物

疾病关系图谱。2.根据权利要求1所述的图谱构建方法,其特征在于,所述疾病间关系图谱中的疾病实体与靶点实体之间的关系的确定步骤,包括:获取所述疾病间关系图谱中用于连接各疾病实体与各靶点实体的信号通路;基于所述信号通路中各节点之间的关系,确定所述信号通路所对应的疾病实体与靶点实体之间的关系。3.根据权利要求2所述的图谱构建方法,其特征在于,所述基于所述信号通路中各节点之间的关系,确定所述信号通路所对应的疾病实体与靶点实体之间的关系,包括:统计所述信号通路中节点之间的关系为负向调节的关系数量;基于所述关系数量,确定所述信号通路所对应的疾病实体与靶点实体之间的关系为正向调节关系或负向调节关系。4.根据权利要求2所述的图谱构建方法,其特征在于,所述疾病间关系图谱中的疾病实体与靶点实体之间的关系的确定步骤,还包括:若所述信号通路存在于所述疾病信号通路图谱中,则确定所述信号通路所对应的疾病实体与靶点实体之间的关系为实际关联关系;否则,确定所述信号通路所对应的疾病实体与靶点实体之间的关系为潜在关联关系。5.根据权利要求1所述的图谱构建方法,其特征在于,所述基于医学研究文献,构建以疾病为单位的疾病信号通路图谱,包括:对所述医学研究文献中的语句进行实体识别,得到所述医学研究文献所包含的实体对,所述实体对包括实体以及所述实体之间的实体关系;基于所述实体和所述实体关系,构建所述以疾病为单位的疾病信号通路图谱。6.根据权利要求5所述的图谱构建方法,其特征在于,所述对所述医学研究文献中的语句进行实体识别,得到所述医学研究文献所包含的实...

【专利技术属性】
技术研发人员:周立运
申请(专利权)人:魔方医药科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1