基于级联分类的病理数据分类方法、装置、设备及介质制造方法及图纸

技术编号:33737321 阅读:12 留言:0更新日期:2022-06-08 21:34
本发明专利技术涉及人工智能技术,揭露了一种基于级联分类的病理数据分类方法,包括:提取在线问诊数据的病理数据特征向量集;根据预设的科系类别,利用级联多标签病理数据预测模型对病理数据向量特征集进行两级分类,得到科系类别标签及对应患者的病理数据种类集标签,对病理数据种类集进行聚合,得到混淆病组集;计算混淆病组集中各个混淆病组的独立置信度及整体置信度、均值置信度;当均值置信度小于或等于阈值时,标签值为特定数值的科系类别及病理数据种类作为识别结论。此外,本发明专利技术还涉及区块链技术,病理数据特征向量集可存储于区块链的节点。本发明专利技术还提出一种基于级联分类的病理数据分类装置、电子设备以及存储介质。本发明专利技术可以提高在线疾病诊断系统病理数据识别的准确性。性。性。

【技术实现步骤摘要】
基于级联分类的病理数据分类方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于级联分类的病理数据分类方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着科技的发展和互联网的普及,特别是移动互联网技术的普及应用,人们的生产生活方式也随之发生巨大变化。在医疗健康领域,在线病理数据诊断方式被越来越多的人接受和使用,在线医疗方式已经可以提供基于患者问诊内容给出病症诊断结果、开出处方等服务。
[0003]现有的在线疾病诊断系统通常聚焦于某一种专科病理数据病理数据或一次只能解决少量种类的病理数据病理数据的分类问题,但是在线疾病诊断系统应用涵盖的科室至少十种以上,需要诊断的病理数据不少于百种,在面对跨科室多病种,尤其是在易混淆、较难鉴别的病种上,当前的在线疾病诊断系统病理数据分类的准确性较低。

技术实现思路

[0004]本专利技术提供一种基于级联分类的病理数据分类方法、装置及计算机可读存储介质,其主要目的在于解决在线疾病诊断系统病理数据识别的准确性较低的问题。
[0005]为实现上述目的,本专利技术提供的一种病理数据基于级联分类的病理数据分类方法,包括:
[0006]获取在线问诊数据,提取所述在线问诊数据的病理数据特征向量集;
[0007]根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类,得到科系类别标签,并计算所述科系类别标签的科系置信度;
[0008]根据所述科系类别标签、所述病理数据向量特征集及预构建的易混淆病理数据种类数据集,利用所述级联多标签病理数据预测模型中的第二分类模型,对所述病理数据特征向量集进行二级分类,得到所述在线问诊数据对应患者的病理数据种类集及病理数据种类集标签,并对所述病理数据种类集进行聚合,得到混淆病组集;
[0009]计算所述混淆病组集中各个混淆病组的独立置信度,根据所述独立置信度计算所述混淆病组集的整体置信度;
[0010]平均所述科系置信度、所述独立置信度及所述整体置信度,得到均值置信度;
[0011]当所述均值置信度大于预设阈值时,将所述独立置信度大于所述阈值的混淆病组对应的病理数据特征向量加入候选待提问症状列表,对患者进行进一步问诊,并返回所述获取在线问诊数据,提取所述在线问诊数据的病理数据特征向量集的步骤,直至所述均值置信度小于或等于预设阈值;
[0012]当所述均值置信度小于或等于预设阈值时,将所述科系类别标签及所述病理数据种类集标签为特定数值的科系类别及病理数据种类作为分类结论。
[0013]可选地,所述提取所述在线问诊数据的病理数据特征向量集,包括:
[0014]利用预设的命名实体识别模型,提取所述在线问诊数据中的症状实体,构建症状实体序列;
[0015]对所述症状实体序列进行随机的删除、同义症状替换、交换位置操作得到干扰症状实体序列;
[0016]利用预设循环神经网络对所述症状实体序列及所述干扰症状实体序列进行编码,得到症状实体向量集及干扰症状实体向量集;
[0017]利用变分自编码器,将所述症状实体向量及所述干扰症状实体向量集进行拟合,得到所述在线问诊数据的病理数据特征向量集。
[0018]可选地,所述根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类之前,所述方法还包括:
[0019]利用K

均值聚类算法构建所述级联多标签病理数据预测模型中的第一分类模型;
[0020]利用卷积神经网络构建所述级联多标签病理数据预测模型中的第二分类模型。
[0021]可选地,所述根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类,得到科系类别标签,包括:
[0022]从所述病理数据特征向量集中随机选择r个病理数据特征向量作为r个初始聚类质心;
[0023]分别计算所述病理数据特征向量集中的每一个病理数据特征向量与所述初始聚类质心的距离;
[0024]按照所述距离的大小,选择K个距离对应的病理数据特征向量,作为聚类的k个聚类质心;
[0025]分别计算所述病理数据特征向量集中每个病理数据特征向量与所述k个聚类质心的欧式距离,并将所述病理数据特征向量归类到所述欧式距离最短的聚类质心所在的类;
[0026]计算每个类中的所述病理数据特征向量的平均值,根据所述平均值更新所述k个聚类质心,并返回上述的分别计算所述病理数据特征向量集中每个病理数据特征向量与所述k个更新后的聚类质心的欧式距离,并将所述病理数据特征向量归类到所述欧式距离最短的聚类质心所在的类的步骤直至收敛,完成对所述病理数据的分类,得到所述在线问诊数据对应患者的科系类别;
[0027]将所述在线问诊数据对应患者的科系类别标记为第一数值,所述预设的科系类别中非在线问诊数据对应患者的科系类别标记为第二数值,得到科系类别标签。
[0028]可选地,所述计算所述科系类别标签的科系置信度,包括:
[0029]利用信息熵计算所述科系类别标签的科系置信度:
[0030][0031]其中,S表示全部2
L
种科系类别组合,L表示科系类别数;P(y
i
)表示科系类别标签。
[0032]可选地,所述根据所述科系类别标签、所述病理数据向量特征集及预构建的易混淆病理数据种类数据集,利用所述级联多标签病理数据预测模型中的第二分类模型,对所述病理数据特征向量集进行二级分类,得到所述在线问诊数据对应患者的病理数据种类集及病理数据种类集标签,包括:
[0033]利用所述第二分类模型中所述卷积层及所述池化层提取所述预构建的易混淆病理数据种类数据集的易混淆病理数据种类特征向量;
[0034]获取所述科系类别标签为第一数值的所述在线问诊数据对应患者的科系类别,根据所述易混淆病理数据种类特征向量,利用所述第二分类模型中第一分类器,对所述对应患者的科系类别进行分类,得到病理数据种类集;
[0035]根据所述病理数据向量特征集,利用所述第二分类模型中第二分类器,对所述对应患者的科系类别进行匹配分类,得到所述在线问诊数据对应患者的病理数据种类;
[0036]将所述在线问诊数据对应患者的病理数据种类标记为第一数值,所述病理数据种类集中非所述在线问诊数据对应患者的病理数据种类标记为第二数值,得到病理数据种类集标签。
[0037]可选地,所述对所述病理数据种类集进行聚合,得到混淆病组集,包括:
[0038]计算所述病理数据种类集中所有病理数据种类特征之间的相似度;
[0039]根据所述相似度与预设的相似度阈值,将所述病理数据种类集中病理数据种类进行聚合,得到混淆病组集。
[0040]为了解决上述问题,本专利技术还提供一种基于区块链的报文处理装置,所述装置包括:...

【技术保护点】

【技术特征摘要】
1.一种基于级联分类的病理数据分类方法,其特征在于,所述方法包括:获取在线问诊数据,提取所述在线问诊数据的病理数据特征向量集;根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类,得到科系类别标签,并计算所述科系类别标签的科系置信度;根据所述科系类别标签、所述病理数据向量特征集及预构建的易混淆病理数据种类数据集,利用所述级联多标签病理数据预测模型中的第二分类模型,对所述病理数据特征向量集进行二级分类,得到所述在线问诊数据对应患者的病理数据种类集及病理数据种类集标签,并对所述病理数据种类集进行聚合,得到混淆病组集;计算所述混淆病组集中各个混淆病组的独立置信度,根据所述独立置信度计算所述混淆病组集的整体置信度;平均所述科系置信度、所述独立置信度及所述整体置信度,得到均值置信度;当所述均值置信度大于预设阈值时,将所述独立置信度大于所述阈值的混淆病组对应的病理数据特征向量加入候选待提问症状列表,对患者进行进一步问诊,并返回所述获取在线问诊数据,提取所述在线问诊数据的病理数据特征向量集的步骤,直至所述均值置信度小于或等于预设阈值;当所述均值置信度小于或等于预设阈值时,将所述科系类别标签及所述病理数据种类集标签为特定数值的科系类别及病理数据种类作为分类结论。2.如权利要求1所述的基于级联分类的病理数据分类方法,其特征在于,所述提取所述在线问诊数据的病理数据特征向量集,包括:利用预设的命名实体识别模型,提取所述在线问诊数据中的症状实体,构建症状实体序列;对所述症状实体序列进行随机的删除、同义症状替换、交换位置操作得到干扰症状实体序列;利用预设循环神经网络对所述症状实体序列及所述干扰症状实体序列进行编码,得到症状实体向量集及干扰症状实体向量集;利用变分自编码器,将所述症状实体向量及所述干扰症状实体向量集进行拟合,得到所述在线问诊数据的病理数据特征向量集。3.如权利要求1所述的基于级联分类的病理数据分类方法,其特征在于,所述根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类之前,所述方法还包括:利用K

均值聚类算法构建所述级联多标签病理数据预测模型中的第一分类模型;利用卷积神经网络构建所述级联多标签病理数据预测模型中的第二分类模型。4.如权利要求1所述的基于级联分类的病理数据分类方法,其特征在于,所述根据预设的科系类别,利用预构建的级联多标签病理数据预测模型中的第一分类模型对所述病理数据向量特征集进行一级分类,得到科系类别标签,包括:从所述病理数据特征向量集中随机选择r个病理数据特征向量作为r个初始聚类质心;分别计算所述病理数据特征向量集中的每一个病理数据特征向量与所述初始聚类质心的距离;
按照所述距离的大小,选择K个距离对应的病理数据特征向量,作为聚类的k个聚类质心;分别计算所述病理数据特征向量集中每个病理数据特征向量与所述k个聚类质心的欧式距离,并将所述病理数据特征向量归类到所述欧式距离最短的聚类质心所在的类;计算每个类中的所述病理数据特征向量的平均值,根据所述平均值更新所述k个聚类质心,并返回上述的分别计算所述病理数据特征向量集中每个病理数据特征向量与所述k个更新后的聚类质心的欧式距离,并将所述病理数据特征向量归类到所述欧式距离最短的聚类质心所在的类的步骤直至收敛,完成对所述病理数据的分类,得到所述在线问诊数据对应患者的科系类别;将所述在线问诊数据对应患者的科系类别标记为第一数值,所述预设的科系类别中非在线问诊数据对应患者的科系类别标记为第二数值,得到科系类别标签。5.如权利要求4所述的基于级联分类的病理数据分类方法,其特征...

【专利技术属性】
技术研发人员:胡意仪阮晓雯陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1