基于医疗信息的指令微调数据生成方法及装置制造方法及图纸

技术编号：43881818 阅读：30 留言：0更新日期：2024-12-31 19:06

本申请提供一种基于医疗信息的指令微调数据生成方法及装置。该方法在获取与预设的医疗信息知识库关联的多个种子任务后，基于配置的任务扩展要求和多个种子任务，生成针对任一种子任务的任务扩展提示信息；将任务扩展提示信息输入训练好的大语言模型，得到不同种子任务扩展出的至少一个子任务；将包含目标任务集和待抽取医疗文档的抽取提示信息输入大语言模型，得到满足所述任务集中各任务的信息抽取结果；基于任务集中的各任务和相应信息抽取结果，生成指令微调数据。该方法可得到具有多样性和复杂性的指令微调数据，确保了医疗信息抽取指令的多样性、复杂性和特异性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及自然语言处理，具体而言，涉及一种基于医疗信息的指令微调数据生成方法及装置。

技术介绍

1、随着信息技术的进步，医疗相关资料数据对医疗活动中的应用有极大的推动。这种文本信息不仅详细描述了医疗过程，还包含了大量有价值的医学信息，例如诊断、治疗、检查、检验、用药、临床的不良事件等病例信息，有着广泛的应用前景，包括但不限于医学信息检索、智能问答系统和临床决策支持。因此，准确地提取医学实体对于充分利用医学信息至关重要。然而，由于医疗相关资料文档为非结构化的特点，从其中提取关键医疗信息是一项严峻的挑战。

2、目前信息实体抽取方法主要包括传统的机器学习算法和深度学习方法。传统方法依赖于人工特征，存在一定的局限性。深度学习方法在实体抽取中的应用日益广泛，大语言模型表现尤为突出，但利用大语言模型生成的指令微调数据，难以满足医疗信息抽取所需的多样性和复杂性。

技术实现思路

1、本申请实施例的目的在于提供一种基于医疗信息的指令微调数据生成方法及装置，可以基于临床诊疗指南和病程记录等医疗知识...

【技术保护点】

1.一种基于医疗信息的指令微调数据生成方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述医疗信息知识库包括临床诊疗指南数据和临床病程数据；

3.如权利要求2所述的方法，其特征在于，所述配置的种子任务格式包括针对临床诊疗指南数据的第一种子任务格式和针对临床病程数据的第二种子任务格式；

4.如权利要求1所述的方法，其特征在于，将所述任务扩展提示信息输入训练好的大语言模型，得到不同种子任务扩展出的至少一个子任务之后，所述方法还包括：

5.如权利要求4所述的方法，其特征在于，所述目标过滤方式包括字符过滤方式和相似度过滤方...

【技术特征摘要】

1.一种基于医疗信息的指令微调数据生成方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述医疗信息知识库包括临床诊疗指南数据和临床病程数据；

5.如权利要求4所述的方法，其特征在于，所述目标过滤方式包括字符过滤方式和相似度过滤方式；

6.如权利要求1所述的方法，其特征在于，所述任务扩展要求的...

【专利技术属性】
技术研发人员：虞明星，宋晓霞，陈旭，许祥军，洪平，刘宁，赵大平，赵辉，王琪，黄克华，
申请(专利权)人：卫宁健康科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人