一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法及系统技术方案

技术编号:43537303 阅读:17 留言:0更新日期:2024-12-03 12:20
本发明专利技术涉及人工智能技术领域,具体为一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法及系统,包括以下步骤:数据采集与预处理,场景构建与参数化,模型微调与优化,微调数据集生成,数据评估;有益效果为:本发明专利技术提出的基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法及系统,面对真实医患对话数据获取的法律与伦理限制,本发明专利技术采用合成数据策略,通过模拟生成数据,有效解决了数据来源问题,同时保护了患者隐私,开辟了医疗AI数据生成的新路径。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体为一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法及系统


技术介绍

1、信息技术的迅猛进步正引领医疗健康领域的数字化转型,电子病历(emr)系统的推广是提升医疗服务质量与效率的核心举措。它不仅高效存储患者信息,还促进了跨科室信息流通,强化了临床决策与疾病防控的数据支持体系。然而,电子病历的编写占用了医护人员大量的工作时间,给医护人员带来沉重负担。

2、人工智能,特别是自然语言处理与机器学习技术,为这一难题提供了新的解法,有望通过自动总结和生成病历来减轻工作负担,提升记录质量。现有技术尝试,如模板填充和关键词抽取,虽初见成效,却难以把握医疗语言的复杂性,包括术语多样性、结构严谨性及对话非结构化特征,生成内容常显浅薄,缺乏个性化和临床价值,尤其在处理特殊情况时易出偏差。

3、因此,如何高效、精确地将医患交流转化为标准病历成为亟待解决的挑战,需要模型不仅掌握语言艺术,还需深入理解医学知识,确保记录既科学严谨又个性化。预训练大型语言模型为自动化病历撰写提供了强大平台,但仍需面对医疗语言适本文档来自技高网...

【技术保护点】

1.一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:所述方法包括以下步骤:

2.根据权利要求1所述的一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:数据采集与预处理,还包括去除敏感信息,识别并剔除不符合规范或质量较低的记录,以及将非结构化文本转换为标准化数据格式。

3.根据权利要求1所述的一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:场景构建与参数化,根据不同科室需求设计对话脚本,并通过参数化控制实现对话内容的个性化生成。

4.根据权利要...

【技术特征摘要】

1.一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:所述方法包括以下步骤:

2.根据权利要求1所述的一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:数据采集与预处理,还包括去除敏感信息,识别并剔除不符合规范或质量较低的记录,以及将非结构化文本转换为标准化数据格式。

3.根据权利要求1所述的一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:场景构建与参数化,根据不同科室需求设计对话脚本,并通过参数化控制实现对话内容的个性化生成。

4.根据权利要求1所述的一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:模型微调与优化,还包括迭代调整prompt策略,以优化模型在特定医疗场景中的表现,并结合已有医患问诊对话数据集进行有监督微调。

5.根据权利要求1所述的一种基于大模型面向医疗行业的用于问诊对话撰写病历微调数据集生成及评估方法,其特征在于:微调数据集生成步,参数化模板设计包括预留变量位置以适应不同患者信息的填充,以及利用编程技术进行参数随机化与填充,以反映真实世界的多样性;

6.一种根据权利要求1-5任意一项所述的基于大模型...

【专利技术属性】
技术研发人员:韩坤李廷韩同冯树新
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1