一种批量投诉的识别方法及装置制造方法及图纸

技术编号:34956624 阅读:16 留言:0更新日期:2022-09-17 12:35
本申请公开了一种批量投诉的识别方法及装置,用以通过计算机自动发现和识别批量投诉,不再依赖人工,提升批量投诉识别的效率和准确率。该方法包括:将接收到的各个投诉文本转化为文本向量;根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;距离用于表征任意两个文本向量对应的投诉文本的语义相近程度;在数量达到设定阈值时,确定预设距离范围内文本向量对应的投诉文本为批量投诉;根据预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。输出批量投诉警报信息。输出批量投诉警报信息。

【技术实现步骤摘要】
一种批量投诉的识别方法及装置


[0001]本申请涉及自然语言处理
,尤其涉及一种批量投诉的识别方法及装置。

技术介绍

[0002]目前,各类运营商客户的投诉服务工作均为人工处理,那么在由于某一个故障导致一大批客户投诉的情况时,这种批量投诉故障前期隐蔽性强,如果不能及时发现和处理将会演变为重大投诉事件。目前的识别和发现批量投诉完全依靠人工,识别周期长,效率低下。因此,目前亟需一种能够通过计算机自动识别和发现批量投诉的方法。

技术实现思路

[0003]本申请示例性的实施方式中提供一种批量投诉的识别方法及装置,用以通过计算机自动发现和识别批量投诉,不再依赖人工,提升批量投诉识别的效率和准确率。
[0004]第一方面,本申请实施例提供了一种批量投诉的识别方法,包括:
[0005]将接收到的各个投诉文本转化为文本向量;
[0006]根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;所述距离用于表征所述任意两个文本向量对应的投诉文本的语义相近程度;
[0007]在所述数量达到设定阈值时,确定所述预设距离范围内文本向量对应的投诉文本为批量投诉;
[0008]根据所述预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。
[0009]基于上述方案,本申请提出了采用计算设备自动处理投诉文本,得到投诉文本对应的文本向量,基于文本向量之间的距离对文本向量进行聚类处理,并根据聚类的结果判断是否存在批量投诉。不再需要依赖人工,提升了批量投诉识别的效率,可以及时解决引起批量投诉的故障问题,避免演变为重大的投诉事件。
[0010]在一些实施例中,所述将接收到的各个投诉文本转化为文本向量,包括:
[0011]将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语;
[0012]将所述多个词语中每一个词语转化为词向量;
[0013]通过多个词向量组成所述任一投诉文本对应的文本向量。
[0014]在一些实施例中,所述将多个词语中每一个词语转化为词向量,包括:
[0015]获取预先构建的多组词语与词向量之间的对应关系;所述对应关系是基于预训练的词向量转化模型生成的;
[0016]根据多组对应关系,确定所述多个词语中每一个词语对应的词向量。
[0017]基于上述方案,根据预先构建的对应关系来实现转化词向量的操作,不仅提升了转化的效率还能够提升转化的准确性。
[0018]在一些实施例中,所述将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语,包括:
[0019]将所述任一投诉文本与预先配置的词语库进行匹配,确定匹配成功的词语;
[0020]将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理,将拆词得到的词语与所述匹配成功的词语组成述任一投诉文本对应的多个词语。
[0021]基于上述方案,拆词处理时,首先根据预先配置的词语库进行匹配,可以准确地识别行业内的专业术语,提升拆词的准确率。
[0022]在一些实施例中,所述根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量,包括:
[0023]分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量之间的距离;
[0024]将与所述第一文本向量距离小于预设值的文本向量的数量,作为所述第一文本向量预设距离范围内的文本向量的数量;
[0025]其中,所述第一文本为所述各文本向量中的任意一个文本向量。
[0026]在一些实施例中,所述方法还包括:
[0027]向投诉处理人员的设备发送所述批量投诉警报信息、所述预设距离范围内文本向量的数量和所述预设距离范围内文本向量对应的投诉文本。
[0028]第二方面,本申请实施例提供了一种批量投诉的识别装置,包括:
[0029]通信单元,用于接收多个投诉文本;
[0030]处理单元,被配置为执行:
[0031]将各个投诉文本转化为文本向量;
[0032]根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;所述距离用于表征所述任意两个文本向量对应的投诉文本的语义相近程度;
[0033]在所述数量达到设定阈值时,确定所述预设距离范围内文本向量对应的投诉文本为批量投诉;
[0034]根据所述预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。
[0035]在一些实施例中,所述处理单元,具体用于:
[0036]将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语;
[0037]将所述多个词语中每一个词语转化为词向量;
[0038]通过多个词向量组成所述任一投诉文本对应的文本向量。
[0039]在一些实施例中,所述处理单元,具体用于:
[0040]获取预先构建的多组词语与词向量之间的对应关系;所述对应关系是基于预训练的词向量转化模型生成的;
[0041]根据多组对应关系,确定所述多个词语中每一个词语对应的词向量。
[0042]在一些实施例中,所述处理单元,具体用于:
[0043]将所述任一投诉文本与预先配置的词语库进行匹配,确定匹配成功的词语;
[0044]将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理,将拆词得到的词语与所述匹配成功的词语组成述任一投诉文本对应的多个词语。
[0045]在一些实施例中,所述处理单元,具体用于:
[0046]分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量之间的距离;
[0047]将与所述第一文本向量距离小于预设值的文本向量的数量,作为所述第一文本向
量预设距离范围内的文本向量的数量;
[0048]其中,所述第一文本为所述各文本向量中的任意一个文本向量。
[0049]在一些实施例中,所述通信单元,还用于:
[0050]向投诉处理人员的设备发送所述批量投诉警报信息、所述预设距离范围内文本向量的数量和所述预设距离范围内文本向量对应的投诉文本。
[0051]第三方面,提供了一种电子设备,所述电子设备包括控制器和存储器。存储器用于存储计算机执行指令,控制器执行存储器中的计算机执行指令以利用控制器中的硬件资源执行第一方面任一种可能实现的方法的操作步骤。
[0052]第四方面,提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
[0053]另外,第二方面至第四方面的有益效果可以参见如第一方面所述的有益效果,此处不再赘述。
附图说明
[0054]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种批量投诉的识别方法,其特征在于,包括:将接收到的各个投诉文本转化为文本向量;根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;所述距离用于表征所述任意两个文本向量对应的投诉文本的语义相近程度;在所述数量达到设定阈值时,确定所述预设距离范围内文本向量对应的投诉文本为批量投诉;根据所述预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。2.根据权利要求1所述的方法,其特征在于,所述将接收到的各个投诉文本转化为文本向量,包括:将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语;将所述多个词语中每一个词语转化为词向量;通过多个词向量组成所述任一投诉文本对应的文本向量。3.根据权利要求2所述的方法,其特征在于,所述将多个词语中每一个词语转化为词向量,包括:获取预先构建的多组词语与词向量之间的对应关系;所述对应关系是基于预训练的词向量转化模型生成的;根据多组对应关系,确定所述多个词语中每一个词语对应的词向量。4.根据权利要求2或3所述的方法,其特征在于,所述将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语,包括:将所述任一投诉文本与预先配置的词语库进行匹配,确定匹配成功的词语;将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理,将拆词得到的词语与所述匹配成功的词语组成述任一投诉文本对应的多个词语。5.根据权利要求1

3任一项所述的方法,其特征在于,所述根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量,包括:分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量之间的距离;将与所述第一文本向量距离小于预设值的文本向量的数量,作为所述第一文本向量预设距离范围内的文本向量的数量;其中,所述第一文本为所述各文本向量中的任意一个文本向量。6.根据权利要求1

3任一项所述的方法,其特征在于,所述方法还包括:向投诉处理人员的设备发送所述批量投诉警报信息、所述预设距离范围内文本向量的数量和所述预设距离范围内文本向量对应的投诉文本。7.一种批量投诉的识别装置,其特征在于,包括:通信单元,用于接收多个投诉文本;处理单元,被配置为执行:将各个投诉文本转化为文本向量;根据任意两个文...

【专利技术属性】
技术研发人员:张辉李俊杨建昆
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1