【技术实现步骤摘要】
本申请涉及人工智能,具体涉及一种用于医疗教学大模型的训练数据构建方法。
技术介绍
1、在医疗教学行业内,医疗教学病例数据一部分是通过医院或医疗院校等专业医疗机构提供的病历信息获取。其中包括了纸质/电子版本病历、一张或多张检查化验单、一段或多段心电图数据、一张或多张x光片、一张或多张b超化验单等。
2、临床病历缺少医疗知识和技能知识,不能作为医疗教学病例使用。同时,病历中包含文本等多种非结构化数据,也不能直接进入深度学习模型当中用于医疗教学大模型进行训练。
3、现阶段,缺少用于医疗教学用的病例,也缺少从多种复杂、繁琐、冗乱的数据信息中,提取有效的,有规律的可用数据并提供给医疗教学大模型进行学习训练,以用于医疗教学领域产品之中。
技术实现思路
1、为了克服现有技术中存在的不足,本申请提供一种用于医疗教学大模型的训练数据构建方法,包括以下步骤:
2、s1.预定义医疗教学用病例json模板;
3、s2.获取医疗教学用病例数据,包括以下步骤:
< ...【技术保护点】
1.一种用于医疗教学大模型的训练数据构建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种用于医疗教学大模型的训练数据构建方法,其特征在于,在对所述检查化验单中每个数据项的标准数据捕获时按所述检查化验单既定规范校验,其中所述数据项及其权重的阈值为:项目代码,权重10%;项目名称,权重30%;检查结果,权重30%;参考范围,权重20%;单位,权重10%;其中,当对每个数据项进行校验后,都捕获到达到其阈值的正常数据内容,则认定所述检查化验单数据项总权重值为100%,则保留并输出;当对每个数据项进行校验后,所述数据项中的多个捕获模糊或丢失,则所述检查
...【技术特征摘要】
1.一种用于医疗教学大模型的训练数据构建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种用于医疗教学大模型的训练数据构建方法,其特征在于,在对所述检查化验单中每个数据项的标准数据捕获时按所述检查化验单既定规范校验,其中所述数据项及其权重的阈值为:项目代码,权重10%;项目名称,权重30%;检查结果,权重30%;参考范围,权重20%;单位,权重10%;其中,当对每个数据项进行校验后,都捕获到达到其阈值的正常数据内容,则认定所述检查化验单数据项总权重值为100%,则保留并输出;当对每个数据项进行校验后,所述数据项中的多个捕获模糊或丢失,则所述检查化验单数据项的总权重小于70%,则所述检查化验单数据项低于阈值,抛弃所述检查化验单数据项。
【专利技术属性】
技术研发人员:李品,龙雨霏,胡寒冰,刘冰,陈媛,
申请(专利权)人:成都中教智汇信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。