药品分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:23315194 阅读:13 留言:0更新日期:2020-02-11 17:49
本发明专利技术实施例公开了一种药品分类方法、装置、计算机设备及存储介质,包括:根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量;将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注为所述使用药品的聚类集中至少一个高频词语。该分类方式能够提高药品分类的效率,且采用病例信息能够进一步的强化药品与病情之间的对应关系,提高了分类结果的准确性。

Drug classification method, device, computer equipment and storage medium

【技术实现步骤摘要】
药品分类方法、装置、计算机设备及存储介质
本专利技术实施例涉及药品分类领域,尤其是一种药品分类方法、装置、计算机设备及存储介质。
技术介绍
药品分类管理是国际通行的管理办法。它是根据药品的安全性、有效性原则,依其品种、规格、适应症、剂量及给药途径等的不同,将药品分为处方药和非处方药并作出相应的管理规定。它的意义在于保障人民用药安全。现有技术中,关于药品分类模型主要从有监督模型入手,为此前期需要大量的人力成本对样本进行标注。人力标注往往存在标注不准确,分类不完善现象,为此还需要大量人力对类别进行增加修改等维护操作。由此导致药品分类耗时耗力,且分类的准确率也较低。
技术实现思路
本专利技术实施例提供能够不需要进行标记就能够完成药品分类的药品分类方法、装置、计算机设备及存储介质。为解决上述技术问题,本专利技术创造的实施例采用的一个技术方案是:提供一种药品分类方法,包括:根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量,其中,所述病例信息为文本信息,所述目标特征词向量包括第一词向量和第二词向量,所述第一词向量通过神经网络模型对所述文本信息进行提取得到,所述第二词向量通过对所述文本信息进停用词过滤后统计得到;将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注为所述使用药品的聚类集中至少一个高频词语。可选地,所述目标特征词向量包括:第一词向量,所述根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量包括:将所述病例信息转化为行为向量集;将所述行为向量集输入至预设的特征提取模型中,其中,所述特征提取模型为预先训练至收敛状态,用于提取行为向量集中表征用户行为向量的神经网络模型;读取所述特征提取模型输出的所述用户行为向量,并定义所述用户行为向量为第一词向量。可选地,所述目标特征词向量包括:第二词向量,所述读取所述特征提取模型输出的所述用户行为向量,并定义所述用户行为向量为第一词向量之后,包括:通过预设的停用词列表对所述病例信息进行过滤生成关键词集;统计所述关键词集中各个关键词的词频以及所述各个关键词的逆文档频率;通过所述词频和所述逆文档频率计算所述各个关键词的优先级数值;根据所述各个关键词的优先级数值生成所述第二词向量。可选地,所述根据所述各个关键词的优先级数值生成所述第二词向量之后,包括:将所述第一词向量与所述第二词向量进行合并生成所述目标特征词向量。可选地,所述将所述目标特征词向量输入至预设的药品分类模型中包括:计算所述目标特征词向量与不同的特征词向量之间的第一欧氏距离;将所述第一欧式距离与预设的第一距离阈值进行比对;当所述第一欧式距离小于所述第一距离阈值时,将所述目标特征向量聚类至所述第一欧式距离表征的聚类集中生成一级聚类集。可选地,所述当所述欧式距离大于所述第一距离阈值时,将所述目标特征向量聚类至所述欧式距离表征的聚类集中生成一级聚类集之后,包括:校正所述药品分类模型中有效点间距的参数值生成第一参数值,并在所述一级聚类集内计算所述目标特征词向量与不同的特征词向量之间的第二欧氏距离;将所述第二欧式距离与预设的第二距离阈值进行比对,其中,所述第二距离阈值小于所述第一距离阈值;当所述第二欧式距离小于所述第二距离阈值时,将所述目标特征向量聚类至所述第二欧式距离表征的聚类集中生成二级聚类集。可选地,所述当所述第二欧式距离大于所述第二距离阈值时,将所述目标特征向量聚类至所述第二欧式距离表征的聚类集中生成二级聚类集之后,包括:校正所述药品分类模型中有效点间距的参数值生成第二参数值,并在所述二级聚类集内计算所述目标特征词向量与不同的特征词向量之间的第三欧氏距离,其中,所述第二参数值小于所述第一参数值;将所述第三欧式距离与预设的第三距离阈值进行比对,其中,所述第三距离阈值小于所述第二距离阈值;当所述第三欧式距离小于所述第三距离阈值时,将所述目标特征向量聚类至所述第三欧式距离表征的聚类集中生成三级聚类集。为解决上述技术问题,本专利技术实施例还提供一种药品分类装置,包括:获取模块,用于根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量,其中,所述病例信息为文本信息,所述目标特征词向量包括第一词向量和第二词向量,所述第一词向量通过神经网络模型对所述文本信息进行提取得到,所述第二词向量通过对所述文本信息进停用词过滤后统计得到;处理模块,用于将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;执行模块,用于根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注为所述使用药品的聚类集中至少一个高频词语。可选地,所述目标特征词向量包括:第一词向量,所述药品分类装置包括:第一转化子模块,用于将所述病例信息转化为行为向量集;第一处理子模块,用于将所述行为向量集输入至预设的特征提取模型中,其中,所述特征提取模型为预先训练至收敛状态,用于提取行为向量集中表征用户行为向量的神经网络模型;第一执行子模块,用于读取所述特征提取模型输出的所述用户行为向量,并定义所述用户行为向量为第一词向量。可选地,所述目标特征词向量包括:第二词向量,所述药品分类装置包括:第一过滤子模块,用于通过预设的停用词列表对所述病例信息进行过滤生成关键词集;第二处理子模块,用于统计所述关键词集中各个关键词的词频以及所述各个关键词的逆文档频率;第一计算子模块,用于通过所述词频和所述逆文档频率计算所述各个关键词的优先级数值;第二执行子模块,用于根据所述各个关键词的优先级数值生成所述第二词向量。可选地,所述药品分类装置包括:第一合并子模块,用于将所述第一词向量与所述第二词向量进行合并生成所述目标特征词向量。可选地,所述药品分类装置包括:第一计算子模块,用于计算所述目标特征词向量与不同的特征词向量之间的第一欧氏距离;第一比对子模块,用于将所述第一欧式距离与预设的第一距离阈值进行比对;第三执行子模块,用于当所述第一欧式距离小于所述第一距离阈值时,将所述目标特征向量聚类至所述第一欧式距离表征的聚类集中生成一级聚类集。可选地,所述药品分类装置包括:第二计算子模块,用于校正所述药品分类模型中有效点间距的参数值生成第一参数值,并在所述一级聚类集内计算所述目标特征词向量与不同的特征词向量之间的第二欧氏距离;第二比对子模块,用于将所述第二欧式距离与预设的第二距离阈值进行比对,其中,所述第二距离阈值小于所述第一距离阈值;第四执行本文档来自技高网...

【技术保护点】
1.一种药品分类方法,其特征在于,包括:/n根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量,其中,所述病例信息为文本信息,所述目标特征词向量包括第一词向量和第二词向量,所述第一词向量通过神经网络模型对所述文本信息进行提取得到,所述第二词向量通过对所述文本信息进停用词过滤后统计得到;/n将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;/n根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注内容为所述使用药品的聚类集中的至少一个高频词语。/n

【技术特征摘要】
1.一种药品分类方法,其特征在于,包括:
根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量,其中,所述病例信息为文本信息,所述目标特征词向量包括第一词向量和第二词向量,所述第一词向量通过神经网络模型对所述文本信息进行提取得到,所述第二词向量通过对所述文本信息进停用词过滤后统计得到;
将所述目标特征词向量输入至预设的药品分类模型中,其中,所述药品分类模型为通过计算不同特征词向量之间的距离进行聚类的无监督训练模型;
根据所述药品分类模型输出的所述使用药品的聚类集,对所述使用药品进行分类标注,其中,所述分类标注内容为所述使用药品的聚类集中的至少一个高频词语。


2.根据权利要求1所述的药品分类方法,其特征在于,所述根据用户的病例信息获取表征用户病情和使用药品的目标特征词向量包括:
将所述病例信息转化为行为向量集;
将所述行为向量集输入至预设的特征提取模型中,其中,所述特征提取模型为预先训练至收敛状态,用于提取行为向量集中表征用户行为向量的神经网络模型;
读取所述特征提取模型输出的所述用户行为向量,并定义所述用户行为向量为第一词向量。


3.根据权利要求2所述的药品分类方法,其特征在于,所述读取所述特征提取模型输出的所述用户行为向量,并定义所述用户行为向量为第一词向量之后,包括:
通过预设的停用词列表对所述病例信息进行过滤生成关键词集;
统计所述关键词集中各个关键词的词频以及所述各个关键词的逆文档频率;
通过所述词频和所述逆文档频率计算所述各个关键词的优先级数值;
根据所述各个关键词的优先级数值生成所述第二词向量。


4.根据权利要求3所述的药品分类方法,其特征在于,所述根据所述各个关键词的优先级数值生成所述第二词向量之后,包括:
将所述第一词向量与所述第二词向量进行合并生成所述目标特征词向量。


5.根据权利要求1所述的药品分类方法,其特征在于,所述将所述目标特征词向量输入至预设的药品分类模型中包括:
计算所述目标特征词向量与不同的特征词向量之间的第一欧氏距离;
将所述第一欧式距离与预设的第一距离阈值进行比对;
当所述第一欧式距离小于所述第一距离阈值时,将所述目标特征向量聚类至所述第一欧式距离表征的聚类集中生成一级聚类集。


6.根据权利要求5所述的药品分类方法,其特征在于,所述当所述欧式距离...

【专利技术属性】
技术研发人员:陈娴娴阮晓雯徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1