当前位置: 首页 > 专利查询>清华大学专利>正文

领域模型训练、业务处理方法、一体机和存储介质技术

技术编号:40595909 阅读:28 留言:0更新日期:2024-03-12 21:58
本发明专利技术提供一种领域模型训练、业务处理方法、一体机和存储介质,其中训练方法包括:拆分执行目标领域下业务所需的多个业务步骤;基于各个业务步骤所对应的知识类型和判断类型,进行业务步骤归类,得到多类原子能力;基于各类原子能力下的问答数据,训练所述目标领域下的领域模型。本发明专利技术提供的方法、一体机和存储介质,使得模型能够学习相较于业务更加简单的原子能力维度下的子任务,从而提高模型对于复杂业务的推理能力。并且,不同业务中可能应用到相同的原子能力,通过以原子能力为单位的模型训练,使得不同业务在模型训练中能够彼此促进,由此提高模型的泛化能力,进而保证模型性能。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种领域模型训练、业务处理方法、一体机和存储介质


技术介绍

1、随着人工智能技术的发展,大型语言模型(large language model,llm)体现出对自然语言的深刻理解和生成能力。如何将大型语言模型应用在医疗领域,受到了广泛的关注。

2、目前常见的实现方案,是重构医疗业务数据,以生成可供大型语言模型训练的数据。但是由于医疗业务本身极其复杂,且医疗业务数据通常是详细的长篇幅文本,针对大型语言模型的训练效果并不理想。


技术实现思路

1、本专利技术提供一种领域模型训练、业务处理方法、一体机和存储介质,用以解决现有技术中由于医疗业务的复杂性导致模型训练效果不佳的缺陷。

2、本专利技术提供一种领域模型训练方法,包括:

3、拆分执行目标领域下业务所需的多个业务步骤;

4、基于各个业务步骤所对应的知识类型和判断类型,进行业务步骤归类,得到多类原子能力;

5、基于各类原子能力下的问答数据,训练所述目标领域下的领域模型。...

【技术保护点】

1.一种领域模型训练方法,其特征在于,包括:

2.根据权利要求1所述的领域模型训练方法,其特征在于,所述基于各类原子能力对应的问答数据,训练所述目标领域下的领域模型,包括:

3.根据权利要求2所述的领域模型训练方法,其特征在于,所述业务下的问答数据的获取步骤包括:

4.根据权利要求1所述的领域模型训练方法,其特征在于,所述原子能力下的问答数据的获取步骤包括:

5.根据权利要求4所述的领域模型训练方法,其特征在于,所述基于各候选问答数据中业务步骤在所述知识类型下的知识点、各候选问答数据来源的业务数据,以及各候选问答数据中的判断结果中的至少一种...

【技术特征摘要】

1.一种领域模型训练方法,其特征在于,包括:

2.根据权利要求1所述的领域模型训练方法,其特征在于,所述基于各类原子能力对应的问答数据,训练所述目标领域下的领域模型,包括:

3.根据权利要求2所述的领域模型训练方法,其特征在于,所述业务下的问答数据的获取步骤包括:

4.根据权利要求1所述的领域模型训练方法,其特征在于,所述原子能力下的问答数据的获取步骤包括:

5.根据权利要求4所述的领域模型训练方法,其特征在于,所述基于各候选问答数据中业务步骤在所述知识类型下的知识点、各候选问答数据来源的业务数据,以及各候选问答数据中的判断结果中的至少一种,从各候选问答数据中选取所述原子能力下的问答数据,包括:

6.根据权利要求1至5中任一项所述的领域模型训练方法,其特征在于,所述拆分执行目标领域下业务所需的多个业务步骤,包括:

7.根据权利要求1至5中任一项所述的...

【专利技术属性】
技术研发人员:吴及刘少辉刘喜恩周开银尤心心
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1