【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种领域模型训练、业务处理方法、一体机和存储介质。
技术介绍
1、随着人工智能技术的发展,大型语言模型(large language model,llm)体现出对自然语言的深刻理解和生成能力。如何将大型语言模型应用在医疗领域,受到了广泛的关注。
2、目前常见的实现方案,是重构医疗业务数据,以生成可供大型语言模型训练的数据。但是由于医疗业务本身极其复杂,且医疗业务数据通常是详细的长篇幅文本,针对大型语言模型的训练效果并不理想。
技术实现思路
1、本专利技术提供一种领域模型训练、业务处理方法、一体机和存储介质,用以解决现有技术中由于医疗业务的复杂性导致模型训练效果不佳的缺陷。
2、本专利技术提供一种领域模型训练方法,包括:
3、拆分执行目标领域下业务所需的多个业务步骤;
4、基于各个业务步骤所对应的知识类型和判断类型,进行业务步骤归类,得到多类原子能力;
5、基于各类原子能力下的问答数据,训练所述目标领
...【技术保护点】
1.一种领域模型训练方法,其特征在于,包括:
2.根据权利要求1所述的领域模型训练方法,其特征在于,所述基于各类原子能力对应的问答数据,训练所述目标领域下的领域模型,包括:
3.根据权利要求2所述的领域模型训练方法,其特征在于,所述业务下的问答数据的获取步骤包括:
4.根据权利要求1所述的领域模型训练方法,其特征在于,所述原子能力下的问答数据的获取步骤包括:
5.根据权利要求4所述的领域模型训练方法,其特征在于,所述基于各候选问答数据中业务步骤在所述知识类型下的知识点、各候选问答数据来源的业务数据,以及各候选问答数据中的
...【技术特征摘要】
1.一种领域模型训练方法,其特征在于,包括:
2.根据权利要求1所述的领域模型训练方法,其特征在于,所述基于各类原子能力对应的问答数据,训练所述目标领域下的领域模型,包括:
3.根据权利要求2所述的领域模型训练方法,其特征在于,所述业务下的问答数据的获取步骤包括:
4.根据权利要求1所述的领域模型训练方法,其特征在于,所述原子能力下的问答数据的获取步骤包括:
5.根据权利要求4所述的领域模型训练方法,其特征在于,所述基于各候选问答数据中业务步骤在所述知识类型下的知识点、各候选问答数据来源的业务数据,以及各候选问答数据中的判断结果中的至少一种,从各候选问答数据中选取所述原子能力下的问答数据,包括:
6.根据权利要求1至5中任一项所述的领域模型训练方法,其特征在于,所述拆分执行目标领域下业务所需的多个业务步骤,包括:
7.根据权利要求1至5中任一项所述的...
【专利技术属性】
技术研发人员:吴及,刘少辉,刘喜恩,周开银,尤心心,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。