基于生成式大模型的保险外呼会话信息输出方法及装置制造方法及图纸

技术编号：39836463 阅读：8 留言：0更新日期：2023-12-29 16:20

本发明专利技术公开了一种基于生成式大模型的保险外呼会话信息输出方法及装置，涉及数据处理技术领域，主要目的在于解决现有基于生成式大模型的保险外呼会话信息输出准确性较低的问题

全部详细技术资料下载

【技术实现步骤摘要】
基于生成式大模型的保险外呼会话信息输出方法及装置

[0001]本专利技术涉及一种数据处理
，特别是涉及一种基于生成式大模型的保险外呼会话信息输出方法及装置
。

技术介绍

[0002]随着保险产品销售方式的不断增多，用户可以通过与电话机器人进行对话的方式咨询不同保险产品信息
。
其中，电话机器人即为保险企业方为用户提供的对话智能算法，从而按照用户的对话内容确定并输出标准的对话回复内容
。
[0003]目前，现有对话智能算法通常采用已完成对话模型训练的机器学习模型，以便预先针对保险条款文本内容
、
保险产品费用结合对话形式内容进行匹配预测，将对话回复内容推送给用户
。
但是，在训练模型时，将大量对话文本以及保险知识形成的对话形式内容作为训练样本语句，会降低模型预测分类的精度，增加模型训练时间，从而降低基于生成式大模型的保险外呼会话信息输出准确性
。

技术实现思路

[0004]有鉴于此，本专利技术提供一种基于生成式大模型的保险外呼会话信息输出方法及装置，主要目的在于解决现有基于生成式大模型的保险外呼会话信息输出准确性较低的问题
。
[0005]依据本专利技术一个方面，提供了一种基于生成式大模型的保险外呼会话信息输出方法，包括：获取对保险产品进行外呼会话咨询时的会话信息；基于已完成训练的生成式大模型对所述会话信息进行分类处理，得到所述会话信息的分类结果，所述生成式大模型为基于对构造的会话样本数据进行交叉区域去...

【技术保护点】

【技术特征摘要】
1.
一种基于生成式大模型的保险外呼会话信息输出方法，其特征在于，包括：获取对保险产品进行外呼会话咨询时的会话信息；基于已完成训练的生成式大模型对所述会话信息进行分类处理，得到所述会话信息的分类结果，所述生成式大模型为基于对构造的会话样本数据进行交叉区域去重处理后的训练样本集进行训练得到的；基于所述分类结果确定所述外呼会话咨询的保险外呼会话信息，并进行输出
。2.
根据权利要求1所述的方法，其特征在于，所述基于已完成训练的生成式大模型对所述会话信息进行分类处理，得到所述会话信息的分类结果之前，所述方法还包括：获取历史会话信息，并按照文本滑窗长度从所述历史会话信息中提取出多个会话样本数据；确定所述会话样本数据的交叉区域，并对所述交叉区域进行去重处理，得到去重处理后的训练样本集，以基于所述训练样本集对所述生成式大模型进行模型训练，所述交叉区域包括时间交叉
、
文本内容交叉
。3.
根据权利要求2所述的方法，其特征在于，所述确定所述会话样本数据的交叉区域，并对所述交叉区域进行去重处理，得到去重处理后的训练样本集包括：解析所述会话样本数据的文本词语，将上一会话样本数据的文本词语与下一会话样本数据的文本词语进行对比，确定文本交叉区域；若所述文本交叉区域对应的目标文本内容被标记为模块化词语，则删除所述目标文本内容；若所述文本交叉区域对应的目标文本内容被标记为非模块化词语，则对所述目标文本内容进行去重处理
。4.
根据权利要求3所述的方法，其特征在于，所述方法还包括：构建待训练的生成式大模型，并获取去重处理后的所述训练样本集；基于所述训练样本集对所述生成式大模型进行训练，并在模型损失值匹配预设损失阈值时，完成所述生成式大模型的训练，所述模型损失值为基于去重所述目标文本内容的所述会话样本数据对模型训练时计算的
。5.
根据权利要求3所述的方法，其特征在于，所述确定所述会话样本数据的交叉区域之前，所述方法还包括：当检测出所述会话样本数据中包含敏感标签时，对所述敏感标签所对应的标签文本进行去标识化处理，所述敏感标识为按照身份敏感信息
、
保险额度敏感信息对所述会话样本...

【专利技术属性】
技术研发人员：沈鹏，许垒，黄婷，李银锋，刘海伦，王之琢，黄明星，周晓波，
申请(专利权)人：北京水滴科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人