药性认知信息抽取方法、装置、设备及存储介质制造方法及图纸

技术编号:28875558 阅读:19 留言:0更新日期:2021-06-15 23:10
本发明专利技术涉及人工智能领域,公开了一种药性认知信息抽取方法、装置、设备及存储介质。所述药性认知信息抽取方法包括:获取药物文献数据,并对所述药物文献数据进行命名实体词抽取,得到所述药物文献数据中各药物对应的药物实体信息;获取由药物信息作为节点构成的药物关系图,并根据各节点的关联关系,对所述药物关系图进行向量化处理,得到多个节点向量;识别所述药物文献数据中各药物实体信息的语义特征,并根据所述语义特征对各所述节点向量进行药性认知判断,得到所述药物信息对应的药性认知信息。本发明专利技术能抽取药物文献中对不同药物的药性认知信息,并补充到现有的药物信息体系中对应的药物认知属性中,使药物信息体系更完善。

【技术实现步骤摘要】
药性认知信息抽取方法、装置、设备及存储介质
本专利技术涉及人工智能领域,尤其涉及一种药性认知信息抽取方法、装置、设备及存储介质。
技术介绍
随着大数据的发展,承载着药物信息的数据库已经囊括了大部分药物相关的信息,例如药物的成分、规格、用法用量、适应症、不良反应等。这些信息可随时查阅,为医生和学者提供了便利。在实际的诊疗过程中,经验丰富的医生往往会积累自己对某些药物的实际药效相关的看法,他们通常还会把这些有参考价值的经验发表成文章,供他人学习。对于一些年轻医生或学者来说,这是需要付出一定的时间和临床实践才能得到的知识,非常宝贵。现有的药物信息体系中并不包含权威医生或机构对药物的药性认知信息,而这些药性认知信息往往会为医生用药时提供一定的参考价值,若能使药物的药性认知信息能像药物的其它属性一样唾手可得,不但能使药物信息体系更完善,还能在医学界形成良好的知识体系,为患者带来更好的治疗效果。
技术实现思路
本专利技术的主要目的在于解决现有药物信息数据库缺乏药物药性的认知信息且药性认知信息抽取困难的技术问题。本专利技术第一方面提供了一种药性认知信息抽取方法,包括:获取药物文献数据,并对所述药物文献数据进行命名实体词抽取,得到所述药物文献数据中各药物对应的药物实体信息;获取由药物信息作为节点构成的药物关系图,并根据各节点的关联关系,对所述药物关系图进行向量化处理,得到多个节点向量;识别所述药物文献数据中各药物实体信息的语义特征,并根据所述语义特征对各所述节点向量进行药性认知判断,得到所述药物信息对应的药性认知信息。可选的,在本专利技术第一方面的第一种实现方式中,所述获取药物文献数据,并对所述药物文献数据进行命名实体词抽取,得到所述药物文献数据中各药物对应的药物实体信息包括:获取带药物主题词的药物文献数据,并将所述药物文献数据输入预置BERT药物向量模型进行向量化处理,得到多个药物句子向量;将所述药物句子向量输入预置药物命名实体识别模型的CNNS层进行字符编码处理,得到药物句子中各词语的字符编码;将各所述字符编码输入所述药物命名实体识别模型的第一双向LSTM层进行前向和后向的隐藏状态捕获,得到各字符编码对应的隐藏状态序列;将所述隐藏状态序列输入所述药物命名实体识别模型的CRF层进行词性标签解码,得到所述药物文献数据中各药物句子的药物实体信息,所述药物实体信息包括药物实体词向量。可选的,在本专利技术第一方面的第二种实现方式中,所述BERT药物向量模型的训练过程包括:S1、初始化BERT模型,并将所述药物文献数据输入所述BERT模型;S2、对所述药物文献数据中的句子进行向量化处理,得到多个目标药物句子向量;S3、根据各所述目标药物句子向量,对所述BERT模型的参数进行微调,并计算所述BERT模型的交叉熵损失函数;S4、判断所述交叉熵损失函数是否收敛,若是,则将当前训练得到的BERT模型作为BERT药物向量模型,否则,重复执行步骤S2-S3,直至所述交叉熵损失函数收敛。可选的,在本专利技术第一方面的第三种实现方式中,所述获取由药物信息作为节点构成的药物关系图,并根据各节点的关联关系,对所述药物关系图进行向量化处理,得到多个节点向量包括:获取由药物信息作为节点构成的药物关系图;根据预置Node2vec算法,构建用于将所述药物关系图中各节点映射为embedding向量的向量映射函数;对所述向量映射函数进行求解,得到所述药物关系图中各节点对应的相邻节点序列,并将各节点对应的相邻节点序列作为各节点对应的节点向量。可选的,在本专利技术第一方面的第四种实现方式中,所述识别所述药物文献数据中各药物实体信息的语义特征,并根据所述语义特征对各所述节点向量进行药性认知判断,得到所述药物信息对应的药性认知信息包括:将所述药物实体信息及所述药物句子向量输入预置TC-LSTM语义情感识别模型进行语义情感特征提取,得到所述药物文献数据中各药物实体信息对应的语义情感特征向量;将各所述语义情感特征向量及各所述节点向量输入预置语义情感分类模型进行药性认知判断,得到所述药物信息对应的药性认知信息。可选的,在本专利技术第一方面的第五种实现方式中,所述将所述药物实体信息及所述药物句子向量输入预置TC-LSTM语义情感识别模型进行语义情感特征提取,得到各所述药物实体信息对应的语义情感特征向量包括:提取所述药物实体信息中的各药物实体词向量,并计算所述各药物实体词向量的平均值,得到目标词向量;拼接所述目标词向量与所述药物句子向量,得到第一拼接向量;将所述第一拼接向量输入预置第二双向LSTM层进行词性隐状态捕获,得到各药物实体词对应的语义情感特征向量。可选的,在本专利技术第一方面的第六种实现方式中,所述将各所述语义情感特征向量及各所述节点向量输入预置语义情感分类模型进行药性认知判断,得到所述药物信息对应的药性认知信息包括:拼接各所述语义情感特征向量及各所述节点向量,得到第二拼接向量;将所述第二拼接向量输入预置语义情感分类模型的Softmax网络进行药性认知的语义情感判断,得到所述药物信息对应的药性认知信息。本专利技术第二方面提供了一种药性认知信息抽取装置,包括:抽取模块,用于获取药物文献数据,并对所述药物文献数据进行命名实体词抽取,得到所述药物文献数据中各药物对应的药物实体信息;向量化模块,用于获取由药物信息作为节点构成的药物关系图,并根据各节点的关联关系,对所述药物关系图进行向量化处理,得到多个节点向量;识别模块,用于识别所述药物文献数据中各药物实体信息的语义特征,并根据所述语义特征对各所述节点向量进行药性认知判断,得到所述药物信息对应的药性认知信息。可选的,在本专利技术第二方面的第一种实现方式中,所述抽取模块具体用于:获取带药物主题词的药物文献数据,并将所述药物文献数据输入预置BERT药物向量模型进行向量化处理,得到多个药物句子向量;将所述药物句子向量输入预置药物命名实体识别模型的CNNS层进行字符编码处理,得到药物句子中各词语的字符编码;将各所述字符编码输入所述药物命名实体识别模型的第一双向LSTM层进行前向和后向的隐藏状态捕获,得到各字符编码对应的隐藏状态序列;将所述隐藏状态序列输入所述药物命名实体识别模型的CRF层进行词性标签解码,得到所述药物文献数据中各药物句子的药物实体信息,所述药物实体信息包括药物实体词向量。可选的,在本专利技术第二方面的第二种实现方式中,所述BERT药物向量模型的训练过程包括:初始化单元,用于初始化BERT模型,并将所述药物文献数据输入所述BERT模型;向量化单元,用于对所述药物文献数据中的句子进行向量化处理,得到多个目标药物句子向量;微调单元,用于根据各所述目标药物句子向量,对所述BERT模型的参数进行微调,并计算所述BERT模型的交叉熵损失函数;收敛单元,用于判断所述本文档来自技高网...

【技术保护点】
1.一种药性认知信息抽取方法,其特征在于,所述药性认知信息抽取方法包括:/n获取药物文献数据,并对所述药物文献数据进行命名实体词抽取,得到所述药物文献数据中各药物对应的药物实体信息;/n获取由药物信息作为节点构成的药物关系图,并根据各节点的关联关系,对所述药物关系图进行向量化处理,得到多个节点向量;/n识别所述药物文献数据中各药物实体信息的语义特征,并根据所述语义特征对各所述节点向量进行药性认知判断,得到所述药物信息对应的药性认知信息。/n

【技术特征摘要】
1.一种药性认知信息抽取方法,其特征在于,所述药性认知信息抽取方法包括:
获取药物文献数据,并对所述药物文献数据进行命名实体词抽取,得到所述药物文献数据中各药物对应的药物实体信息;
获取由药物信息作为节点构成的药物关系图,并根据各节点的关联关系,对所述药物关系图进行向量化处理,得到多个节点向量;
识别所述药物文献数据中各药物实体信息的语义特征,并根据所述语义特征对各所述节点向量进行药性认知判断,得到所述药物信息对应的药性认知信息。


2.根据权利要求1所述的药性认知信息抽取方法,其特征在于,所述获取药物文献数据,并对所述药物文献数据进行命名实体词抽取,得到所述药物文献数据中各药物对应的药物实体信息包括:
获取带药物主题词的药物文献数据,并将所述药物文献数据输入预置BERT药物向量模型进行向量化处理,得到多个药物句子向量;
将所述药物句子向量输入预置药物命名实体识别模型的CNNS层进行字符编码处理,得到药物句子中各词语的字符编码;
将各所述字符编码输入所述药物命名实体识别模型的第一双向LSTM层进行前向和后向的隐藏状态捕获,得到各字符编码对应的隐藏状态序列;
将所述隐藏状态序列输入所述药物命名实体识别模型的CRF层进行词性标签解码,得到所述药物文献数据中各药物句子的药物实体信息,所述药物实体信息包括药物实体词向量。


3.根据权利要求2所述的药性认知信息抽取方法,其特征在于,所述BERT药物向量模型的训练过程包括:
S1、初始化BERT模型,并将所述药物文献数据输入所述BERT模型;
S2、对所述药物文献数据中的句子进行向量化处理,得到多个目标药物句子向量;
S3、根据各所述目标药物句子向量,对所述BERT模型的参数进行微调,并计算所述BERT模型的交叉熵损失函数;
S4、判断所述交叉熵损失函数是否收敛,若是,则将当前训练得到的BERT模型作为BERT药物向量模型,否则,重复执行步骤S2-S3,直至所述交叉熵损失函数收敛。


4.根据权利要求1所述的药性认知信息抽取方法,其特征在于,所述获取由药物信息作为节点构成的药物关系图,并根据各节点的关联关系,对所述药物关系图进行向量化处理,得到多个节点向量包括:
获取由药物信息作为节点构成的药物关系图;
根据预置Node2vec算法,构建用于将所述药物关系图中各节点映射为embedding向量的向量映射函数;
对所述向量映射函数进行求解,得到所述药物关系图中各节点对应的相邻节点序列,并将各节点对应的相邻节点序列作为各节点对应的节点向量。


5.根据权利要求2所述的药性认知信息抽取方法,其特征在...

【专利技术属性】
技术研发人员:付桂振顾大中徐任翔
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1