基于生成式大模型的保险外呼会话信息输出方法及装置制造方法及图纸

技术编号:39836463 阅读:8 留言:0更新日期:2023-12-29 16:20
本发明专利技术公开了一种基于生成式大模型的保险外呼会话信息输出方法及装置,涉及数据处理技术领域,主要目的在于解决现有基于生成式大模型的保险外呼会话信息输出准确性较低的问题

【技术实现步骤摘要】
基于生成式大模型的保险外呼会话信息输出方法及装置


[0001]本专利技术涉及一种数据处理
,特别是涉及一种基于生成式大模型的保险外呼会话信息输出方法及装置


技术介绍

[0002]随着保险产品销售方式的不断增多,用户可以通过与电话机器人进行对话的方式咨询不同保险产品信息

其中,电话机器人即为保险企业方为用户提供的对话智能算法,从而按照用户的对话内容确定并输出标准的对话回复内容

[0003]目前,现有对话智能算法通常采用已完成对话模型训练的机器学习模型,以便预先针对保险条款文本内容

保险产品费用结合对话形式内容进行匹配预测,将对话回复内容推送给用户

但是,在训练模型时,将大量对话文本以及保险知识形成的对话形式内容作为训练样本语句,会降低模型预测分类的精度,增加模型训练时间,从而降低基于生成式大模型的保险外呼会话信息输出准确性


技术实现思路

[0004]有鉴于此,本专利技术提供一种基于生成式大模型的保险外呼会话信息输出方法及装置,主要目的在于解决现有基于生成式大模型的保险外呼会话信息输出准确性较低的问题

[0005]依据本专利技术一个方面,提供了一种基于生成式大模型的保险外呼会话信息输出方法,包括:获取对保险产品进行外呼会话咨询时的会话信息;基于已完成训练的生成式大模型对所述会话信息进行分类处理,得到所述会话信息的分类结果,所述生成式大模型为基于对构造的会话样本数据进行交叉区域去重处理后的训练样本集进行训练得到的;基于所述分类结果确定所述外呼会话咨询的保险外呼会话信息,并进行输出

[0006]进一步地,所述基于已完成训练的生成式大模型对所述会话信息进行分类处理,得到所述会话信息的分类结果之前,所述方法还包括:获取历史会话信息,并按照文本滑窗长度从所述历史会话信息中提取出多个会话样本数据;确定所述会话样本数据的交叉区域,并对所述交叉区域进行去重处理,得到去重处理后的训练样本集,以基于所述训练样本集对所述生成式大模型进行模型训练,所述交叉区域包括时间交叉

文本内容交叉

[0007]进一步地,所述确定所述会话样本数据的交叉区域,并对所述交叉区域进行去重处理,得到去重处理后的训练样本集,包括:解析所述会话样本数据的文本词语,将上一会话样本数据的文本词语与下一会话样本数据的文本词语进行对比,确定文本交叉区域;
若所述文本交叉区域对应的目标文本内容被标记为模块化词语,则删除所述目标文本内容;若所述文本交叉区域对应的目标文本内容被标记为非模块化词语,则对所述目标文本内容进行去重处理

[0008]进一步地,所述方法还包括:构建待训练的生成式大模型,并获取去重处理后的所述训练样本集;基于所述训练样本集对所述生成式大模型进行训练,并在模型损失值匹配预设损失阈值时,完成所述生成式大模型的训练,所述模型损失值为基于去重所述目标文本内容的所述会话样本数据对模型训练时计算的

[0009]进一步地,所述确定所述会话样本数据的交叉区域之前,所述方法还包括:当检测出所述会话样本数据中包含敏感标签时,对所述敏感标签所对应的标签文本进行去标识化处理,所述敏感标识为按照身份敏感信息

保险额度敏感信息对所述会话样本数据进行标记得到的

[0010]进一步地,所述基于所述分类结果确定所述外呼会话咨询的保险外呼会话信息,并进行输出包括:基于预设产品会话词语库查找与所述分类结果匹配的会话回复关键词,所述预设产品会话词语库中存储有不同分类结果对应的会话回复关键词;基于会话语句构造策略生成包含有所述会话回复关键词的保险外呼会话信息,并进行输出,所述会话语句构造策略中包括不同语类

不同词性的补充文本与所述会话回复关键词进行构造语句的方法

[0011]进一步地,所述方法还包括:在输出所述保险外呼会话信息后接收到的新一轮会话信息中包含所述会话回复关键词,则解析所述会话回复关键词的意图信息,所述意图信息用于表征所述保险产品的二次咨询对象;从保险产品信息咨询数据库中调取与所述意图信息匹配的二次咨询对象,并进行输出,所述保险产品信息咨询数据库中存储有不同意图信息对应的二次咨询对象

[0012]依据本专利技术另一个方面,提供了一种基于生成式大模型的保险外呼会话信息输出装置,包括:获取模块,用于获取对保险产品进行外呼会话咨询时的会话信息;处理模块,用于基于已完成训练的生成式大模型对所述会话信息进行分类处理,得到所述会话信息的分类结果,所述生成式大模型为基于对构造的会话样本数据进行交叉区域去重处理后的训练样本集进行训练得到的;确定模块,用于基于所述分类结果确定所述外呼会话咨询的保险外呼会话信息,并进行输出

[0013]进一步地,所述获取模块,还用于获取历史会话信息,并按照文本滑窗长度从所述历史会话信息中提取出多个会话样本数据;所述确定模块,还用于确定所述会话样本数据的交叉区域,并对所述交叉区域进行去重处理,得到去重处理后的训练样本集,以基于所述训练样本集对所述生成式大模型
进行模型训练,所述交叉区域包括时间交叉

文本内容交叉

[0014]进一步地,所述确定模块,具体还用于解析所述会话样本数据的文本词语,将上一会话样本数据的文本词语与下一会话样本数据的文本词语进行对比,确定文本交叉区域;若所述文本交叉区域对应的目标文本内容被标记为模块化词语,则删除所述目标文本内容;若所述文本交叉区域对应的目标文本内容被标记为非模块化词语,则对所述目标文本内容进行去重处理

[0015]进一步地,所述装置还包括:构造模块,用于构建待训练的生成式大模型,并获取去重处理后的所述训练样本集;训练模块,用于基于所述训练样本集对所述生成式大模型进行训练,并在模型损失值匹配预设损失阈值时,完成所述生成式大模型的训练,所述模型损失值为基于去重所述目标文本内容的所述会话样本数据对模型训练时计算的

[0016]进一步地,所述处理模块,具体还用于当检测出所述会话样本数据中包含敏感标签时,对所述敏感标签所对应的标签文本进行去标识化处理,所述敏感标识为按照身份敏感信息

保险额度敏感信息对所述会话样本数据进行标记得到的

[0017]进一步地,所述确定模块,具体还用于基于预设产品会话词语库查找与所述分类结果匹配的会话回复关键词,所述预设产品会话词语库中存储有不同分类结果对应的会话回复关键词;基于会话语句构造策略生成包含有所述会话回复关键词的保险外呼会话信息,并进行输出,所述会话语句构造策略中包括不同语类

不同词性的补充文本与所述会话回复关键词进行构造语句的方法

[0018]进一步地,所述装置还包括:解析模块,用于在输出所述保险外呼会话信息后接收到的新一轮会话本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于生成式大模型的保险外呼会话信息输出方法,其特征在于,包括:获取对保险产品进行外呼会话咨询时的会话信息;基于已完成训练的生成式大模型对所述会话信息进行分类处理,得到所述会话信息的分类结果,所述生成式大模型为基于对构造的会话样本数据进行交叉区域去重处理后的训练样本集进行训练得到的;基于所述分类结果确定所述外呼会话咨询的保险外呼会话信息,并进行输出
。2.
根据权利要求1所述的方法,其特征在于,所述基于已完成训练的生成式大模型对所述会话信息进行分类处理,得到所述会话信息的分类结果之前,所述方法还包括:获取历史会话信息,并按照文本滑窗长度从所述历史会话信息中提取出多个会话样本数据;确定所述会话样本数据的交叉区域,并对所述交叉区域进行去重处理,得到去重处理后的训练样本集,以基于所述训练样本集对所述生成式大模型进行模型训练,所述交叉区域包括时间交叉

文本内容交叉
。3.
根据权利要求2所述的方法,其特征在于,所述确定所述会话样本数据的交叉区域,并对所述交叉区域进行去重处理,得到去重处理后的训练样本集包括:解析所述会话样本数据的文本词语,将上一会话样本数据的文本词语与下一会话样本数据的文本词语进行对比,确定文本交叉区域;若所述文本交叉区域对应的目标文本内容被标记为模块化词语,则删除所述目标文本内容;若所述文本交叉区域对应的目标文本内容被标记为非模块化词语,则对所述目标文本内容进行去重处理
。4.
根据权利要求3所述的方法,其特征在于,所述方法还包括:构建待训练的生成式大模型,并获取去重处理后的所述训练样本集;基于所述训练样本集对所述生成式大模型进行训练,并在模型损失值匹配预设损失阈值时,完成所述生成式大模型的训练,所述模型损失值为基于去重所述目标文本内容的所述会话样本数据对模型训练时计算的
。5.
根据权利要求3所述的方法,其特征在于,所述确定所述会话样本数据的交叉区域之前,所述方法还包括:当检测出所述会话样本数据中包含敏感标签时,对所述敏感标签所对应的标签文本进行去标识化处理,所述敏感标识为按照身份敏感信息

保险额度敏感信息对所述会话样本...

【专利技术属性】
技术研发人员:沈鹏许垒黄婷李银锋刘海伦王之琢黄明星周晓波
申请(专利权)人:北京水滴科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1