【技术实现步骤摘要】
药品分类方法、装置、计算机设备及存储介质
本专利技术实施例涉及药品分类领域,尤其是一种药品分类方法、装置、计算机设备及存储介质。
技术介绍
药品分类管理是国际通行的管理办法。它是根据药品的安全性、有效性原则,依其品种、规格、适应症、剂量及给药途径等的不同,将药品分为处方药和非处方药并作出相应的管理规定。它的意义在于保障人民用药安全。现有技术中,关于药品分类模型主要从有监督模型入手,为此前期需要大量的人力成本对样本进行标注。人力标注往往存在标注不准确,分类不完善现象,为此还需要大量人力对类别进行增加修改等维护操作。由此导致药品分类耗时耗力,且分类的准确率也较低。
技术实现思路
本专利技术实施例提供能够不需要进行标记就能够完成药品分类的药品分类方法、装置、计算机设备及存储介质。为解决上述技术问题,本专利技术创造的实施例采用的一个技术方案是:提供一种药品分类方法,包括:根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量,其中,所述病例信息为文本信息,所述目标特征词向量包括第一词向量和第二词向量,所述第一词向量通过神经网络模型对所述文本信息进行提取得到,所述第二词向量通过对所述文本信息进停用词过滤后统计得到;将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注为所述使用药品的聚类 ...
【技术保护点】
1.一种药品分类方法,其特征在于,包括:/n根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量,其中,所述病例信息为文本信息,所述目标特征词向量包括第一词向量和第二词向量,所述第一词向量通过神经网络模型对所述文本信息进行提取得到,所述第二词向量通过对所述文本信息进停用词过滤后统计得到;/n将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;/n根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注内容为所述使用药品的聚类集中的至少一个高频词语。/n
【技术特征摘要】
1.一种药品分类方法,其特征在于,包括:
根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量,其中,所述病例信息为文本信息,所述目标特征词向量包括第一词向量和第二词向量,所述第一词向量通过神经网络模型对所述文本信息进行提取得到,所述第二词向量通过对所述文本信息进停用词过滤后统计得到;
将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;
根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注内容为所述使用药品的聚类集中的至少一个高频词语。
2.根据权利要求1所述的药品分类方法,其特征在于,所述根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量包括:
将所述病例信息转化为行为向量集;
将所述行为向量集输入至预设的特征提取模型中,其中,所述特征提取模型为预先训练至收敛状态,用于提取行为向量集中表征用户行为向量的神经网络模型;
读取所述特征提取模型输出的所述用户行为向量,并定义所述用户行为向量为第一词向量。
3.根据权利要求2所述的药品分类方法,其特征在于,所述读取所述特征提取模型输出的所述用户行为向量,并定义所述用户行为向量为第一词向量之后,包括:
通过预设的停用词列表对所述病例信息进行过滤生成关键词集;
统计所述关键词集中各个关键词的词频以及所述各个关键词的逆文档频率;
通过所述词频和所述逆文档频率计算所述各个关键词的优先级数值;
根据所述各个关键词的优先级数值生成所述第二词向量。
4.根据权利要求3所述的药品分类方法,其特征在于,所述根据所述各个关键词的优先级数值生成所述第二词向量之后,包括:
将所述第一词向量与所述第二词向量进行合并生成所述目标特征词向量。
5.根据权利要求1所述的药品分类方法,其特征在于,所述将所述目标特征词向量输入至预设的药品分类模型中包括:
计算所述目标特征词向量与不同的特征词向量之间的第一欧氏距离;
将所述第一欧式距离与预设的第一距离阈值进行比对;
当所述第一欧式距离小于所述第一距离阈值时,将所述目标特征向量聚类至所述第一欧式距离表征的聚类集中生成一级聚类集。
6.根据权利要求5所述的药品分类方法,其特征在于,所述当所述欧式距离...
【专利技术属性】
技术研发人员:陈娴娴,阮晓雯,徐亮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。