一种基于融合算法的高危用户投诉预警方法技术

技术编号:36958366 阅读:14 留言:0更新日期:2023-03-22 19:18
本发明专利技术提出了一种基于融合算法的高危用户投诉预警方法,涉及大数据与AI技术领域。其包括获取用户语音文本数据、图谱结构的用户特征数据和用户行为数据;用户语音文本数据、用户特征数据和用户行为数据通过特定模型进行信息抽取分别得到文本语意向量V1、用户特征向量V2和用户行为特征向量V3;根据向量V1、向量V2、向量V3计算第一融合向量V12、第二融合向量和第三融合向量后计算全局融合向量;将全局融合向量输入全连接网络中还原得到各向量的拟合值,计算各向量真实值与拟合值的最小化差值,并进行目标任务训练和样本预测;很大程度提升了投诉预测的准确性。提升了投诉预测的准确性。提升了投诉预测的准确性。

【技术实现步骤摘要】
一种基于融合算法的高危用户投诉预警方法


[0001]本专利技术涉及大数据与AI
,具体而言,涉及一种基于融合算法的高危用户投诉预警方法。

技术介绍

[0002]随着互联网技术的发展,人们生活所需的方方面面由线下转到了线上,如电商平台和互联网金融平台等。在这些平台为人们的生活带来便捷的同时也涉及到在线服务的各方面问题。因此,随着各大平台活跃用户和成单量不断提升,随之而来时的是用户对于平台服务不满意带来的投诉量也在提升。传统的处理越级投诉的方式是在用户给客服打电话进行投诉时,对用户的投诉内容及需求进行记录形成工单,然后通过专业人员对工单进行分析过滤,判断哪些用户可能会进行越级投诉,进而对这些用户进行重点安抚,以减少越级投诉量。然而,人工筛选过滤方式对真正投诉用户的命中率特别低,导致大多真正投诉用户并未得到重点安抚,导致越级投诉量一直未能有实质性减少。

技术实现思路

[0003]本专利技术的目的在于提供一种基于融合算法的高危用户投诉预警方法,其能够解决用户越级投诉问题中特征数据稀疏的问题,同时可挖掘更多的用户信息以及特征间的潜在关联信息,通过融合多维度信息很大程度提升预测的准确性。
[0004]本专利技术的实施例是这样实现的:
[0005]本申请实施例提供一种基于融合算法的高危用户投诉预警方法,其包括如下步骤,S1、数据获取:获取用户语音文本数据、图谱结构的用户特征数据和用户行为数据;S2、特征提取:上述用户语音文本数据、上述用户特征数据和上述用户行为数据通过特定模型进行信息抽取分别得到用户的文本语意向量V1、用户特征向量V2和用户行为特征向量V3;S3、特征融合:获取提取到的文本语意向量V1、用户特征向量V2、用户行为特征向量V3;计算第一融合向量V12:V12=W12V1+W21V2(1

4),其中W12为向量V1的第一语意权重,W21为向量V2的第一用户权重;计算第二融合向量:V13=W13V1+W31V3(1

5),其中W13为向量V1的第二语意权重,W21为向量V3的第一行为权重;计算第三融合向量:V23=W23V2+W32V3(1

6),其中W23为向量V2的第二用户权重,W32为向量V3的第二行为权重;根据上述第一融合向量、上述第二融合向量和上述第二融合向量计算得到全局融合向量:V123=W1V12+W2V13+W3V23(1

7),其中W1为上述第一融合向量的第一融合权重,W2为上述第二融合向量的第二融合权重,W2为上述第二融合向量的第二融合权重;将上述全局融合向量输入全连接网络FC1、FC2和FC3中还原得到向量V1的拟合值、向量V2的拟合值和向量V3的拟合值,使用自监督学习的方式进行网络结构的训练;其中,向量V1的拟合值表示为向量V2的拟合值表示为向量V3的拟合值表示为向量V3的拟合值表示为计算向量V1、向量V2和向量V3的真实值与各向量的拟合值的
最小化差值:S4、目标任务训练:采用基于训练好的向量融合框架,依据上述最小化差值选择上述全局融合向量输入全连接网络,并使用真实投诉类别标签对预测结果进行目标任务训练得到训练模型,以在模型中接入下游任务计算得到预测结果,训练过程表示为S5、样本预测:将样本输入上述训练模型,选取softmax输入概率最大的真实投诉类别标签作为该用户是否为风险用户的标签,以softmax风险类别对应概率作为该用户的风险概率值。
[0006]在本专利技术的一些实施例中,上述步骤S1数据获取中,获取上述语音文本数据包括,当用户使用客服热线时,接入ASR模块将用户的语音转换为文本信息进行记录;以及当用户使用在线客服时,记录用户输入的文本信息。
[0007]在本专利技术的一些实施例中,上述步骤S1数据获取中,获取上述用户特征数据包括,当用户使用客服热线以及当用户使用在线客服时,通过智能核身功能验证用户的身份信息后,从用户数据库中拉取用户相关的特征信息,然后设计对应的图谱本体,形成基于用户个体的图谱结构特征数据。
[0008]在本专利技术的一些实施例中,上述用户相关的特征信息包括用户性别、所在地址和年龄。
[0009]在本专利技术的一些实施例中,上述步骤S1数据获取中,获取上述用户行为数据包括,当用户使用客服热线以及当用户使用在线客服时,获取一段时间内用户在窗口上的行为信息。
[0010]在本专利技术的一些实施例中,上述用户在窗口上的行为信息包括物品的点击、观看、收藏、转发、以及访问在线客服的行为序列。
[0011]在本专利技术的一些实施例中,上述步骤S2特征提取中,具体包括:利用预训练语言模型ERINIE对上述用户语音文本数据进行文本语意信息的提取,以将文本数据进行编码得到用户的文本语意向量V1表示为V1=ERINIE(Text)(1

1);上述用户特征数据以图谱的形式进行组织,使用GAT网络对各个关系空间和节点采用不同的权重进行信息抽取,以得到用户的用户特征向量V2,表示为V2=GAT(User_Feature)(1

2);上述用户行为信息以时序的形式进行组织,采用GRU网络进行时序数据的特征提取,以得到用户的用户行为特征向量V3,V3=GRU(Act_seq)(1

3)。
[0012]相对于现有技术,本专利技术的实施例至少具有如下优点或有益效果:
[0013]1、在高危投诉用户的预测过程中,采用了不同类型的不同结构的数据,如语音文本数据、基于用户特征的图谱数据和用户行为序列数据;并根据数据特征进行数据的特定结构构造,比如用户特征数据以图谱的形式进行构建,可以尽可能多的挖掘出特征间潜在的关联信息。
[0014]2、采用基于自监督网络形式进行特征融合过程的构建,即将各特征向量通过级联融合的方式形成全局融合向量,然后再采用对应解码器全连接网络,将其还原为原本的各特征向量,以此保证特征融合过程不会发生信息丢失,使得生成的隐藏向量能包含所有的特征信息。
[0015]3、采用局部预训练

微调的形式进行下游任务训练,以实现在预训练好的全局融
合向量基础上进一步实现对目标任务的拟合。
[0016]本申请使用用户特征图谱数据、用户行为序列数据、用户进线时语音和文本数据等多维度数据作为输入,搭建新的融合算法模型,通过对不同类型的数据进行特征提取后将信息进行融合,通过融合后的包含用户多维度的信息进行用户越级投诉概率的预测。本专利技术可以实现对通过语音或在线的方式进线的用户可能发生越级投诉概率的预测,便于客服人员能够提早精准干预,减少用户的越级投诉量,提升用户体验。解决了用户越级投诉问题中特征数据稀疏的问题,同时可挖掘更多的用户信息以及特征间的潜在关联信息,通过融合多维度信息很大程度提升预测的准确性。
附图说明
[0017]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于融合算法的高危用户投诉预警方法,其特征在于,包括如下步骤,S1、数据获取:获取用户语音文本数据、图谱结构的用户特征数据和用户行为数据;S2、特征提取:所述用户语音文本数据、所述用户特征数据和所述用户行为数据通过特定模型进行信息抽取分别得到用户的文本语意向量V1、用户特征向量V2和用户行为特征向量V3;S3、特征融合:获取提取到的文本语意向量V1、用户特征向量V2、用户行为特征向量V3;计算第一融合向量V12:V12=W12V1+W21V2(1

4),其中W12为向量V1的第一语意权重,W21为向量V2的第一用户权重;计算第二融合向量:V13=W13V1+W31V3(1

5),其中W13为向量V1的第二语意权重,W21为向量V3的第一行为权重;计算第三融合向量:V23=W23V2+W32V3(1

6),其中W23为向量V2的第二用户权重,W32为向量V3的第二行为权重;根据所述第一融合向量、所述第二融合向量和所述第二融合向量计算得到全局融合向量:V123=W1V12+W2V13+W3V23(1

7),其中W1为所述第一融合向量的第一融合权重,W2为所述第二融合向量的第二融合权重,W2为所述第二融合向量的第二融合权重;将所述全局融合向量输入全连接网络FC1、FC2和FC3中还原得到向量V1的拟合值、向量V2的拟合值和向量V3的拟合值,使用自监督学习的方式进行网络结构的训练;其中,向量V1的拟合值表示为(1

8),向量V2的拟合值表示为向量V3的拟合值表示为计算向量V1、向量V2和向量V3的真实值与各向量的拟合值的最小化差值:S4、目标任务训练:采用基于训练好的向量融合框架,依据所述最小化差值选择所述全局融合向量输入全连接网络,并使用真实投诉类别标签对预测结果进行目标任务训练得到训练模型,以在模型中接入下游任务计算得到预测结果,训练过程表示为S5、样本预测:将样本输入所述训练模型,选取softmax输入概率最大的真实投诉类别标签作为该用户是否为风...

【专利技术属性】
技术研发人员:杨康王宣皓唐文华
申请(专利权)人:天翼电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1