基于大模型适用于垂直领域的智能会话方法及系统技术方案

技术编号:41362147 阅读:41 留言:0更新日期:2024-05-20 10:11
本发明专利技术提供了一种基于大模型适用于垂直领域的智能会话方法及系统,包括以下步骤:S1:收集垂直领域语料,对所述垂直领域语料进行去重、清洗和格式处理,获得垂直领域数据集;S2:采用所述垂直领域数据集和通用领域数据集训练预训练语言模型,所述预训练语言模型基于deepspeed框架,采用chatglm2‑6b作为基座模型,并对所述预训练语言模型进行微调更新,得到会话模型;S3:采用连续批量输入数据的方式,实现所述会话模型的模型推理;S4:对所述会话模型进行私有化部署;S5:通过所述会话模型进行人机会话。本发明专利技术构建了适用于垂直领域的会话模型,实现垂直领域的人机会话。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,更为具体地,涉及一种基于大模型适用于垂直领域的智能会话方法及系统


技术介绍

1、当前大型语言模型正在改变世界,尽管业界已经发布了很多大模型,通用大模型虽然表现出很强的能力,但在没有经过专业领域数据训练的条件下很难完成专业领域任务,在特定的领域表现一般,同时这些大模型通常都比较难以训练和部署。

2、因此,需要构建一个应用于特定领域的语言处理大模型,能够很好地完成特定领域的会话任务。


技术实现思路

1、鉴于上述问题,本专利技术的目的是提供一种基于大模型适用于垂直领域的智能会话方法及系统,使用垂直领域的数据训练模型,构建适用于特定领域的会话模型,并且能够快速地训练、部署与推理,应用于智能客服系统,以提高服务质量和效率,提升客户使用感受。

2、本专利技术提供的一种基于大模型适用于垂直领域的智能会话方法,包括以下步骤:

3、s1:收集垂直领域语料,对所述垂直领域语料进行去重、清洗和格式处理,获得垂直领域数据集;

4、s2:采用所述垂直领域数据本文档来自技高网...

【技术保护点】

1.一种基于大模型适用于垂直领域的智能会话方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤S1中,收集垂直领域语料,包括:

3.如权利要求1所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤S1中,对所述垂直领域语料进行去重、清洗,包括:

4.如权利要求3所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤S1中,对所述垂直领域语料进行格式处理,包括:

5.如权利要求1所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤S2中,对...

【技术特征摘要】

1.一种基于大模型适用于垂直领域的智能会话方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤s1中,收集垂直领域语料,包括:

3.如权利要求1所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤s1中,对所述垂直领域语料进行去重、清洗,包括:

4.如权利要求3所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤s1中,对所述垂直领域语料进行格式处理,包括:

5.如权利要求1所述的基于大模型适用于垂直领域的智能会话方法,其特征在于,所述步骤s2中,对所述预训练语言模型进行微调更新,包括:

6.如权利...

【专利技术属性】
技术研发人员:杨正良
申请(专利权)人:华信永道北京科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1