【技术实现步骤摘要】
基于关系抽取及知识推理的药物发现方法、装置及设备
本申请涉及到人工智能领域,特别是涉及到一种基于关系抽取及知识推理的药物发现方法、装置和计算机设备。
技术介绍
辅助药物研发的主要技术是发现或寻找对疾病有疗效或者有潜在治疗效果的物质,支撑后续的药物研发过程。目前对于药物发现的技术主要利用药理物质的化学结构以及性质的相似性发现新药,这种方式需要依赖高质量的知识丰富的化学物结构、性质、相互作用的知识库,构建成本极高,而且很多化合物新被研究出来的知识、性质无法被利用。关于新药研发的另一个主要思路是从海量的文献中自动挖掘物质、疾病之间的治疗关系,从而发现候选的药物,不过这种方式挖掘到的很多都是已经存在的知识,对于药物发现的推动性不大。目前,已经有相关技术利用医学知识图谱中的药物-靶标-疾病来寻找潜在的治疗药物,但关于物质-基因、基因-疾病等医学关系抽取的研究基本都是针对于二元关系抽取,没有判别给定物质-基因、基因-疾病实体对的具体的关系类型(靶标、致病、靶向治疗等具体的关系类型),无法很好的支撑药物发现。 >
技术实现思路
...
【技术保护点】
1.一种基于关系抽取及知识推理的药物发现方法,其特征在于,包括:/n利用预设的关系抽取模型对包含物质-基因实体对或基因-疾病实体对的自然语句进行实体对关系抽取,获得物质-基因实体对的关系类型和基因-疾病实体对的关系类型;/n根据物质-基因实体对的关系类型计算物质靶向基因的第一可能性得分;/n根据基因-疾病实体对的关系类型计算基因作为疾病的靶向基因的第二可能性得分;/n通过相同的基因,关联得到物质-疾病实体对,根据所述第一可能性得分和所述第二可能性得分计算物质作为疾病的治疗物质的第三可能性得分;/n当所述第三可能性得分大于预设阈值时,则认为物质为疾病的治疗药物。/n
【技术特征摘要】
1.一种基于关系抽取及知识推理的药物发现方法,其特征在于,包括:
利用预设的关系抽取模型对包含物质-基因实体对或基因-疾病实体对的自然语句进行实体对关系抽取,获得物质-基因实体对的关系类型和基因-疾病实体对的关系类型;
根据物质-基因实体对的关系类型计算物质靶向基因的第一可能性得分;
根据基因-疾病实体对的关系类型计算基因作为疾病的靶向基因的第二可能性得分;
通过相同的基因,关联得到物质-疾病实体对,根据所述第一可能性得分和所述第二可能性得分计算物质作为疾病的治疗物质的第三可能性得分;
当所述第三可能性得分大于预设阈值时,则认为物质为疾病的治疗药物。
2.根据权利要求1所述的基于关系抽取及知识推理的药物发现方法,其特征在于,所述利用预设的关系抽取模型对包含物质-基因实体对或基因-疾病实体对的自然语句进行实体对关系抽取,获得物质-基因实体对的关系类型和基因-疾病实体对的关系类型的步骤,包括:
在医学资料库中获取包含物质-基因实体对或基因-疾病实体对的自然语句,对所述自然语句进行分词处理和依存关系分析;
利用预先训练的BERT模型对每一个词进行wordembedding操作,得到词向量e-wordi;
利用word2vec方法对每一个词进行Denpendecyembedding操作,得到依存向量e-depi;
利用公式ei=(e-wordi:e-depi),i=1,..n将每个词的词向量和依存向量串联拼接起来得到每个词的向量表示ei,其中n表示分词后的词的总数;
将向量(ei,...,en)输入到Bi-LSTM层得到隐藏向量(h1,...,hn);
将Bi-LSTM层的输出(h1,...,hn)进行Attention操作得到向量vector;
将向量vector通过全连接层得到输出标签y,具体公式为y=s0ftmax(W*vector),其中W是参数,softmax是多分类任务的激活函数,y是物质-基因或基因-疾病实体对的关系类型。
3.根据权利要求2所述的基于关系抽取及知识推理的药物发现方法,其特征在于,所述将Bi-LSTM层的输出(h1,...,hn)进行Attention操作得到向量vector的步骤中所述Attention操作的计算过程为:
vector=∑iαihi,i=1,...,n。
4.根据权利要求1~3任一项所述的基于关系抽取及知识推理的药物发现方法,其特征在于,所述物质-基因实体对的关系类型包括3种,包括:
第一物质-基因实体对关系类型,表示无法判断物质-基因的关系或者是无关系;
第二物质-基因实体对关系类型,表示可以判断判断物质靶向治疗基因;
第三物质-基因实体对关系类型,表示可以判断物质可以引起基因变化;
所述基因-疾病实体对的关系类型包括4种,包括:
第一基因-疾病实体对关系类型,表示无法判断基因-疾病的关系或者是无关系;
第二基因-疾病实体对关系类型,表示基因是疾病的靶点基因;
第三基因-疾病实体对关系...
【专利技术属性】
技术研发人员:张圣,顾大中,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。