【技术实现步骤摘要】
疾病蕴含训练集的构造方法及装置
本专利技术涉及医疗疾病
,特别涉及疾病蕴含训练集的构造方法及装置。
技术介绍
疾病蕴含关系对分析疾病之间的关系十分重要,一般对疾病蕴含关系是采用单纯的人工进行构建的,但是人工构建不仅需要大量的专业知识,还需要大量的专业人员对目前10万量级的疾病术语进行人工标注,工作量很大,耗时耗力,而且,还可能存在人为疏忽,导致构造的疾病蕴含关系不合理,因此智能化构造疾病蕴含训练集就显得尤为重要。
技术实现思路
本专利技术提供疾病蕴含训练集的构造方法及装置,用以通过对疾病知识树结构进行加工处理得到蕴含和不蕴含关系,并实现自动构造疾病蕴含数据集的目的,其速度快,可大大减少人工的工作量。本专利技术提供疾病蕴含训练集的构造方法,包括:步骤S1:基于预先存储的疾病数据集,建立疾病知识树结构;步骤S2:基于建立的疾病知识树结构,构造相应的蕴含关系和不蕴含关系;步骤S3:根据所述蕴含关系和不蕴含关系,构造疾病蕴含训练集。在一种可能实现的方式中,在执行所述步 ...
【技术保护点】
1.疾病蕴含训练集的构造方法,其特征在于,包括:/n步骤S1:基于预先存储的疾病数据集,建立疾病知识树结构;/n步骤S2:基于建立的疾病知识树结构,构造相应的蕴含关系和不蕴含关系;/n步骤S3:根据所述蕴含关系和不蕴含关系,构造疾病蕴含训练集。/n
【技术特征摘要】
1.疾病蕴含训练集的构造方法,其特征在于,包括:
步骤S1:基于预先存储的疾病数据集,建立疾病知识树结构;
步骤S2:基于建立的疾病知识树结构,构造相应的蕴含关系和不蕴含关系;
步骤S3:根据所述蕴含关系和不蕴含关系,构造疾病蕴含训练集。
2.如权利要求1所述的构造方法,其特征在于,在执行所述步骤S1之后,且在执行所述步骤S2之前,包括:
步骤S11:获取所述疾病知识树结构中的第一节点对应的第一预设词汇;
步骤S12:确定所获取的所述第一预设词汇对应的祖先节点的第二预设词汇;
步骤S13:判断所述第一预设词汇是否与所述第二预设词汇相同,若是,保留所述第二预设词汇对应的祖先节点,并消除第一预设词汇对应的第一节点;否则,不执行任何操作。
3.如权利要求2所述的方法,其特征在于,在执行所述步骤S13之后,且在执行所述步骤S2之前,还包括:
步骤S131:获取所述疾病知识树结构中的第三预设词汇对应的待消除节点;
步骤S132:确定所有所述第三预设词汇在所述疾病知识树结构中的位置权重;
步骤S133:根据所确定的位置权重结果,获取第三预设词汇的最大位置权重;
步骤S134:根据所获取的最大位置权重,保留所述最大位置权重对应的待消除节点,同时消除其余待消除节点。
4.如权利要求3所述的构造方法,其特征在于,在执行所述步骤S134之后,且在执行所述步骤S2之前,还包括:
步骤1341:在所述步骤S134的基础上获取所述疾病知识树结构中的剩余节点,确定所述剩余节点中的每个非叶子节点的节点长度,并将节点长度大于预设长度、且符合疾病命名规则的非叶子节点标记为描述性节点,其余非叶子节点标记为非描述性节点,其中,所述描述性节点不作为构造疾病蕴含训练集的候选节点;
步骤S1342:获取所述疾病知识树结构中的叶子节点,根据所述叶子节点和与所述叶子节点相关的非描述性节点,构造节点蕴含关系规则;
同时,根据所述剩余节点,构造新的疾病知识树结构。
5.如权利要求4所述的构造方法,其特征在于,在执行所述步骤S2的过程中,根据所述新的疾病知识树结构,构造相应的蕴含关系,其步骤包括:
步骤S21:获取所述新的疾病知识树结构中的叶子节点;
步骤S22:基于所述新的疾病知识树结构,获取所述步骤S21所获取的叶子节点的父节点;
步骤S23:根据所述节点蕴含关系规则,判断所获取的所述叶子节点和父节点是否为描述性节点;
若所述叶子节点和所述父节点都是非描述性节点,则所述叶子节点和所述父节点生成第一蕴含对;
若所述叶子节点不是描述性节点,且父节点是描...
【专利技术属性】
技术研发人员:任禾,
申请(专利权)人:云知声智能科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。