客户异议挖掘方法和装置、电子设备及存储介质制造方法及图纸

技术编号：38759758 阅读：9 留言：0更新日期：2023-09-10 09:44

本申请实施例提供了一种客户异议挖掘方法和装置、电子设备及存储介质，属于人工智能技术领域。该方法包括：获取通话文本，通话文本包括已知异议文本和未知异议文本；将已知异议文本输入至预训练模型；基于通话文本对预训练模型进行模型微调，计算每个通话文本的向量化表示，得到向量化文本；对向量化文本进行聚类，将相似语义的向量化文本归类为相同类别，得到聚类结果；对聚类结果进行筛选，得到新增的客户异议。基于此，本申请实施例能够自动挖掘新增的客户异议，解决目前人工挖掘中存在人力成本高、覆盖面较小和实时性低的问题。覆盖面较小和实时性低的问题。覆盖面较小和实时性低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
客户异议挖掘方法和装置、电子设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种客户异议挖掘方法和装置、电子设备及存储介质。

技术介绍

[0002]保险电话销售在进行客户经营、产品销售等业务过程中，会面临不同类型的客户异议(比如：我不需要保险、已经买过保险了)。现有的电销助手会对客户异议进行识别，并推荐给坐席相应的应答话术，以辅助坐席进行答复。但随着新产品上市、经济社会发展、居民生活改善等内外部环境变化，客户异议也会发生改变，不断有新的异议产生。目前对于新增的客户异议，主要采用人工挖掘的方式，由业务人员人工筛选出未覆盖的异议。该方案主要存在3个缺点：
[0003](1)人力成本高：每日坐席通话量很大(千万级通话文本数)，需要大量人力。且人员培训和管理也存在难点，如：新人培训、人员离职等；
[0004](2)覆盖面较小：由于坐席通话量很大且人力有限，目前只覆盖了成交件(占比小于5％)，大量坐席的通话没有覆盖；
[0005](3)实时性低：新异议的挖掘周期较长，一般超过1个月，无法适应产品迭代速度。

技术实现思路

[0006]本申请实施例的主要目的在于提出一种客户异议挖掘方法和装置、电子设备及存储介质，能够自动挖掘新增的客户异议，解决目前人工挖掘中存在人力成本高、覆盖面较小和实时性低的问题。
[0007]为实现上述目的，本申请实施例的第一方面提出了一种客户异议挖掘方法，所述方法包括：
[0008]获取通话文本，所述通话文本包括已知异议文本和未知异议文...

【技术保护点】

【技术特征摘要】
1.一种客户异议挖掘方法，其特征在于，所述方法包括：获取通话文本，所述通话文本包括已知异议文本和未知异议文本；将所述已知异议文本输入至预训练模型；基于所述通话文本对所述预训练模型进行模型微调，计算每个所述通话文本的向量化表示，得到向量化文本；对向量化文本进行聚类，将相似语义的所述向量化文本归类为相同类别，得到聚类结果；对所述聚类结果进行筛选，得到新增的客户异议。2.根据权利要求1所述的方法，其特征在于，所述预训练模型包括基于BERT的文本编码器、线性层和softmax层，所述将所述已知异议文本输入至预训练模型，包括：将所述已知异议文本中输入至基于BERT的文本编码器，计算得到所述已知异议文本中每个字符的向量化表示；选择每个字符中的首字符对应的所述向量化表示作为所述已知异议文本的句向量表示；将所述句向量表示输入至线性层和softmax层，得到所述已知异议文本属于第i类异议的概率，其中，i为大于1的正整数。3.根据权利要求1所述的方法，其特征在于，所述基于所述通话文本对所述预训练模型进行模型微调，计算每个所述通话文本的向量化表示，得到向量化文本，包括：对所述通话文本的数据进行数据增强，得到已知异议的增强数据和未知异议的增强数据；根据所述已知异议的增强数据和所述未知异议的增强数据确定半监督对比损失、监督损失和正则项；根据所述半监督对比损失、所述监督损失和所述正则项确定模型微调的训练目标；基于所述模型微调的训练目标对所述预训练模型进行模型微调；计算每个所述未知异议文本的向量化表示，得到向量化文本。4.根据权利要求1所述的方法，其特征在于，所述对向量化文本进行聚类，将相似语义的所述向量化文本归类为相同类别，得到聚类结果，包括：获取所述未知异议文本的句向量；确定聚类算法的类别数量；对每个数据，计算每个所述数据与多个类别的初始中心的距离，并将所述数据归类到距离最近的类别；对每个类别，计算类别内所有数据的句向量的平均值作为新的类别中心，直到所有数据的类别划分不再发生变化；采用聚类算法将相似文本被划分为相同类...

【专利技术属性】
技术研发人员：孙泽烨，马龙，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人