【技术实现步骤摘要】
适应症信息处理方法与装置、存储介质、电子设备
本公开涉及计算机
,尤其涉及一种适应症信息处理方法与适应症信息处理装置、计算机可读存储介质及电子设备。
技术介绍
药品费用占整个医疗费用很高的比例,因此,合理用药是险种控费的重要环节。尤其对病人的诊断信息和用药信息进行审核,也是健康险控费中必不可少的一步。其中,合理用药的主要依据是药品的适应症、剂量、禁忌症和不良反应等信息。对这些信息加以利用,计算药品的相似度可以为合理用药提供判断基准。在现有的药品相似度计算中,多为基于适应症关键词的算法,有的是根据词频-反转文件频率(termfrequency–inversedocumentfrequency,简称TF-IDF)计算余弦相似度,有的是根据适应症数据中的医学术语,利用关联规则算法计算相似度。但是,这些方法均是从词语层面上解决药品的相似度问题,药品分类的准确度较低,给控制医疗理赔费用增加了难度。鉴于此,本领域亟需开发一种新的适应症信息处理方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对 ...
【技术保护点】
1.一种适应症信息处理方法,其特征在于,所述方法包括:/n获取待分类药品的适应症信息,并对所述适应症信息进行分词处理,得到词序列;/n根据词向量模型对所述词序列进行向量转换,得到第一词向量序列;/n获取药品语义库中已分类适应症信息的第二词向量序列,并利用孪生长短期记忆网络模型确定所述第一词向量序列与所述第二词向量序列之间的相似度;其中,所述孪生长短期记忆网络模型是基于句子对样本和样本相似度形成的;/n根据所述相似度确定与所述适应症信息对应的药品类别,以对所述待分类药品进行分类。/n
【技术特征摘要】
1.一种适应症信息处理方法,其特征在于,所述方法包括:
获取待分类药品的适应症信息,并对所述适应症信息进行分词处理,得到词序列;
根据词向量模型对所述词序列进行向量转换,得到第一词向量序列;
获取药品语义库中已分类适应症信息的第二词向量序列,并利用孪生长短期记忆网络模型确定所述第一词向量序列与所述第二词向量序列之间的相似度;其中,所述孪生长短期记忆网络模型是基于句子对样本和样本相似度形成的;
根据所述相似度确定与所述适应症信息对应的药品类别,以对所述待分类药品进行分类。
2.根据权利要求1所述的适应症信息处理方法,其特征在于,在所述获取待分类药品的适应症信息之前,所述方法还包括:
获取待分类药品的药品说明书,并从所述药品说明书中提取所述待分类药品的字段信息;
根据所述字段信息确定所述待分类药品的属性信息。
3.根据权利要求2所述的适应症信息处理方法,其特征在于,所述根据所述字段信息确定所述待分类药品的属性信息,包括:
获取与所述字段信息对应的属性规则;
根据所述属性规则对所述字段信息进行判断,以根据判断结果确定所述待分类药品的属性信息。
4.根据权利要求3所述的适应症信息处理方法,其特征在于,所述获取药品语义库中已分类适应症信息的第二词向量序列,并确定所述第一词向量序列与所述第二词向量序列之间的相似度,包括:
在药品语义库的已分类适应症信息中,获取与所述属性信息对应的第二词向量序列;
将所述第一词向量序列与所述第二词向量序列输入至预先训练好的孪生长短期记忆网络模型中,得到所述第一词向量序列和所述第二词向量序列之间的相似度。
5.根据权利要求4所述的适应症信息处理方法,其特征在于,在所述将所述第一词向量序列与所述第二词向量序列输入至预先训练好的孪生长短期记忆网络模型中之前,所述方法还包括:
获取所述已分类适应症信息,并将所述已分类适应症信息进行两两组合,得到适应症信息句子对;
对所述适应症信息句子对进行打标签处理,以生成训练所述孪生长短期记忆网络模型的多个句子对样本和与所述句子对样本对...
【专利技术属性】
技术研发人员:陈兴,
申请(专利权)人:泰康保险集团股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。