模型训练方法、文本识别方法、电子设备及可读存储装置制造方法及图纸

技术编号：36813519 阅读：17 留言：0更新日期：2023-03-09 00:59

本申请公开了一种基于智能客服的模型训练方法、文本识别方法、电子设备及计算机可读存储装置。该模型训练方法包括：获取智能客服的文本训练集，其中，文本训练集包括正样本和负样本，正样本包括两个相同的文本，负样本包括不同文本；将正样本以及若干负样本输入智能客户模型，获取智能客户模型的对于正样本的第一预测语义相似度，以及负样本的第二预测语义相似度；基于正样本的第一预测语义相似度，以及若干负样本的第二预测语义相似度，获取智能客户模型的预测损失值；按照预测损失值，与文本训练集的标记相似度对智能客户模型进行训练，以得到最终的智能客户模型。通过上述方式，本申请能够使得智能客户模型返回的结果更准确。确。确。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、文本识别方法、电子设备及可读存储装置

[0001]本申请涉及数据处理领域，特别是涉及一种模型训练方法、文本识别方法、电子设备及计算机可读存储装置。

技术介绍

[0002]近年来，智能客服被广泛应用于各种领域，在智能客服使用之前，需要对其进行模型训练以改善服务质量，提高客户满意度。通常传统的智能客服模型的回复是基于大量的文本数据，使用BM25或浅层的神经网络来回数据进行召回排序，根据排序高低来返回对应的结果。这种方式虽然速度快，但是由于上述技术没有语义分析能力或语义分析能力较差，因此其无法对文本的语义进行准确完整的分析，返回的结果准确率较低。而当智能客服返回的文本结果不准确时，容易降低客户的满意程度。

技术实现思路

[0003]本申请主要目的是提供一种基于智能客服端的模型训练方法、文本识别方法、电子设备及计算机可读存储装置，能够解决智能客户模型返回结果不准确的技术问题。
[0004]为解决上述技术问题，本申请采用的第一个技术方案是：提供一种基于智能客服的模型训练方法。该方法包括：获取智能客服的文本训练集，其中，文本训练集包括正样本和负样本，正样本包括两个相同的文本，负样本包括不同文本；将正样本以及若干负样本输入智能客户模型，获取智能客户模型的对于正样本的第一预测语义相似度，以及负样本的第二预测语义相似度；基于正样本的第一预测语义相似度，以及若干负样本的第二预测语义相似度，获取智能客户模型的预测损失值；按照预测损失值，与文本训练集的标记相似度对智能客户模型进行训练，以得到最终的智能客...

【技术保护点】

【技术特征摘要】
1.一种基于智能客服的模型训练方法，其特征在于，所述模型训练方法包括：获取所述智能客服的文本训练集，其中，所述文本训练集包括正样本和负样本，所述正样本包括两个相同的文本，所述负样本包括不同文本；将所述正样本以及若干所述负样本输入智能客户模型，获取所述智能客户模型的对于所述正样本的第一预测语义相似度，以及所述负样本的第二预测语义相似度；基于所述正样本的第一预测语义相似度，以及若干所述负样本的第二预测语义相似度，获取所述智能客户模型的预测损失值；按照所述预测损失值，与所述文本训练集的标记相似度对所述智能客户模型进行训练，以得到最终的智能客户模型。2.根据权利要求1所述的方法，其特征在于，所述预测损失值包括simcse模型的损失值加上与所述正样本对应的均方误差损失值。3.根据权利要求2所述的方法，其特征在于，所述预测损失值为其中，为所述第一预测语义相似度、s(z
i
，z
j
)为所述第二预测语义相似度、T为温度系数、为所述正样本对应的均方误差损失值。4.根据权利要求1所述的方法，其特征在于，所述智能客户模型包括若干的编码模块以及采样模块，所述编码模块用于基于所述文本得...

【专利技术属性】
技术研发人员：詹乐，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人