【技术实现步骤摘要】
本申请涉及自然语言处理,具体而言,涉及一种基于医疗信息的指令微调数据生成方法及装置。
技术介绍
1、随着信息技术的进步,医疗相关资料数据对医疗活动中的应用有极大的推动。这种文本信息不仅详细描述了医疗过程,还包含了大量有价值的医学信息,例如诊断、治疗、检查、检验、用药、临床的不良事件等病例信息,有着广泛的应用前景,包括但不限于医学信息检索、智能问答系统和临床决策支持。因此,准确地提取医学实体对于充分利用医学信息至关重要。然而,由于医疗相关资料文档为非结构化的特点,从其中提取关键医疗信息是一项严峻的挑战。
2、目前信息实体抽取方法主要包括传统的机器学习算法和深度学习方法。传统方法依赖于人工特征,存在一定的局限性。深度学习方法在实体抽取中的应用日益广泛,大语言模型表现尤为突出,但利用大语言模型生成的指令微调数据,难以满足医疗信息抽取所需的多样性和复杂性。
技术实现思路
1、本申请实施例的目的在于提供一种基于医疗信息的指令微调数据生成方法及装置,可以基于临床诊疗指南和病程记录等医疗知识
...【技术保护点】
1.一种基于医疗信息的指令微调数据生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述医疗信息知识库包括临床诊疗指南数据和临床病程数据;
3.如权利要求2所述的方法,其特征在于,所述配置的种子任务格式包括针对临床诊疗指南数据的第一种子任务格式和针对临床病程数据的第二种子任务格式;
4.如权利要求1所述的方法,其特征在于,将所述任务扩展提示信息输入训练好的大语言模型,得到不同种子任务扩展出的至少一个子任务之后,所述方法还包括:
5.如权利要求4所述的方法,其特征在于,所述目标过滤方式包括字符过
...【技术特征摘要】
1.一种基于医疗信息的指令微调数据生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述医疗信息知识库包括临床诊疗指南数据和临床病程数据;
3.如权利要求2所述的方法,其特征在于,所述配置的种子任务格式包括针对临床诊疗指南数据的第一种子任务格式和针对临床病程数据的第二种子任务格式;
4.如权利要求1所述的方法,其特征在于,将所述任务扩展提示信息输入训练好的大语言模型,得到不同种子任务扩展出的至少一个子任务之后,所述方法还包括:
5.如权利要求4所述的方法,其特征在于,所述目标过滤方式包括字符过滤方式和相似度过滤方式;
6.如权利要求1所述的方法,其特征在于,所述任务扩展要求的...
【专利技术属性】
技术研发人员:虞明星,宋晓霞,陈旭,许祥军,洪平,刘宁,赵大平,赵辉,王琪,黄克华,
申请(专利权)人:卫宁健康科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。