【技术实现步骤摘要】
基于级联分类的病理数据分类方法、装置、设备及介质
[0001]本专利技术涉及人工智能
,尤其涉及一种基于级联分类的病理数据分类方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着科技的发展和互联网的普及,特别是移动互联网技术的普及应用,人们的生产生活方式也随之发生巨大变化。在医疗健康领域,在线病理数据诊断方式被越来越多的人接受和使用,在线医疗方式已经可以提供基于患者问诊内容给出病症诊断结果、开出处方等服务。
[0003]现有的在线疾病诊断系统通常聚焦于某一种专科病理数据病理数据或一次只能解决少量种类的病理数据病理数据的分类问题,但是在线疾病诊断系统应用涵盖的科室至少十种以上,需要诊断的病理数据不少于百种,在面对跨科室多病种,尤其是在易混淆、较难鉴别的病种上,当前的在线疾病诊断系统病理数据分类的准确性较低。
技术实现思路
[0004]本专利技术提供一种基于级联分类的病理数据分类方法、装置及计算机可读存储介质,其主要目的在于解决在线疾病诊断系统病理数据识别的准确性较低的问题。
[0005]为实现上述目的,本专利技术提供的一种病理数据基于级联分类的病理数据分类方法,包括:
[0006]获取在线问诊数据,提取所述在线问诊数据的病理数据特征向量集;
[0007]根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类,得到科系类别标签,并计算所述科系类别标签的科系置信度;
[0008]根据所述科
【技术保护点】
【技术特征摘要】
1.一种基于级联分类的病理数据分类方法,其特征在于,所述方法包括:获取在线问诊数据,提取所述在线问诊数据的病理数据特征向量集;根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类,得到科系类别标签,并计算所述科系类别标签的科系置信度;根据所述科系类别标签、所述病理数据向量特征集及预构建的易混淆病理数据种类数据集,利用所述级联多标签病理数据预测模型中的第二分类模型,对所述病理数据特征向量集进行二级分类,得到所述在线问诊数据对应患者的病理数据种类集及病理数据种类集标签,并对所述病理数据种类集进行聚合,得到混淆病组集;计算所述混淆病组集中各个混淆病组的独立置信度,根据所述独立置信度计算所述混淆病组集的整体置信度;平均所述科系置信度、所述独立置信度及所述整体置信度,得到均值置信度;当所述均值置信度大于预设阈值时,将所述独立置信度大于所述阈值的混淆病组对应的病理数据特征向量加入候选待提问症状列表,对患者进行进一步问诊,并返回所述获取在线问诊数据,提取所述在线问诊数据的病理数据特征向量集的步骤,直至所述均值置信度小于或等于预设阈值;当所述均值置信度小于或等于预设阈值时,将所述科系类别标签及所述病理数据种类集标签为特定数值的科系类别及病理数据种类作为分类结论。2.如权利要求1所述的基于级联分类的病理数据分类方法,其特征在于,所述提取所述在线问诊数据的病理数据特征向量集,包括:利用预设的命名实体识别模型,提取所述在线问诊数据中的症状实体,构建症状实体序列;对所述症状实体序列进行随机的删除、同义症状替换、交换位置操作得到干扰症状实体序列;利用预设循环神经网络对所述症状实体序列及所述干扰症状实体序列进行编码,得到症状实体向量集及干扰症状实体向量集;利用变分自编码器,将所述症状实体向量及所述干扰症状实体向量集进行拟合,得到所述在线问诊数据的病理数据特征向量集。3.如权利要求1所述的基于级联分类的病理数据分类方法,其特征在于,所述根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类之前,所述方法还包括:利用K
‑
均值聚类算法构建所述级联多标签病理数据预测模型中的第一分类模型;利用卷积神经网络构建所述级联多标签病理数据预测模型中的第二分类模型。4.如权利要求1所述的基于级联分类的病理数据分类方法,其特征在于,所述根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类,得到科系类别标签,包括:从所述病理数据特征向量集中随机选择r个病理数据特征向量作为r个初始聚类质心;分别计算所述病理数据特征向量集中的每一个病理数据特征向量与所述初始聚类质心的距离;
按照所述距离的大小,选择K个距离对应的病理数据特征向量,作为聚类的k个聚类质心;分别计算所述病理数据特征向量集中每个病理数据特征向量与所述k个聚类质心的欧式距离,并将所述病理数据特征向量归类到所述欧式距离最短的聚类质心所在的类;计算每个类中的所述病理数据特征向量的平均值,根据所述平均值更新所述k个聚类质心,并返回上述的分别计算所述病理数据特征向量集中每个病理数据特征向量与所述k个更新后的聚类质心的欧式距离,并将所述病理数据特征向量归类到所述欧式距离最短的聚类质心所在的类的步骤直至收敛,完成对所述病理数据的分类,得到所述在线问诊数据对应患者的科系类别;将所述在线问诊数据对应患者的科系类别标记为第一数值,所述预设的科系类别中非在线问诊数据对应患者的科系类别标记为第二数值,得到科系类别标签。5.如权利要求4所述的基于级联分类的病理数据分类方法,其特征...
【专利技术属性】
技术研发人员:胡意仪,阮晓雯,陈远旭,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。