基于序列标注的文本处理方法、装置、设备和介质制造方法及图纸

技术编号:38759173 阅读:15 留言:0更新日期:2023-09-10 09:44
本申请提供一种基于序列标注的文本处理方法、装置、设备和介质,涉及人工智能技术领域。该方法包括:获取目标分析模型和目标文本信息,所述目标文本信息中包括有用户对目标主体发起的反馈和发起该反馈的原因;根据所述目标分析模型,标注所述目标文本信息中的反馈主体和反馈原因,所述反馈主体和所述反馈原因均包括至少一个词语;根据所述反馈主体和反馈原因,从历史反馈单中获取目标反馈单;获取该目标反馈单对应的处理结果,并将该目标反馈单和该处理结果推送至目标对象。本方案能够提高金融机构的工作人员对客户反馈单的处理效率。融机构的工作人员对客户反馈单的处理效率。融机构的工作人员对客户反馈单的处理效率。

【技术实现步骤摘要】
基于序列标注的文本处理方法、装置、设备和介质


[0001]本申请涉及人工智能领域,尤其涉及一种基于序列标注的文本处理方法、装置、设备和介质。

技术介绍

[0002]对于大型的金融机构,业务量和客户量巨大,每日都会收到上千笔客户针对某个事件发起的反馈和反馈原因,这些反馈信息都需要及时的查阅并给出对应的处理策略,以保证和提升客户的体验。
[0003]目前,现有技术在面对大量客户的反馈信息时,通常都是人工的方式查阅反馈文本信息,然后通过分析从中提炼出客户所反馈的主体和反馈原因。
[0004]但是这种人工提炼的方式过于依赖主观判断,容易引起判断和处理上的误判,提炼效果较差,造成后续无法准确的给出处理策略。

技术实现思路

[0005]本申请提供一种基于序列标注的文本处理方法、装置、设备和介质,用以解决目前人工对客户反馈单提炼,提炼不准确,造成后续无法准确的处理客户反馈的问题。
[0006]第一方面,本申请提供一种基于序列标注的文本处理方法,包括:
[0007]获取目标分析模型和目标文本信息,所述目标文本信息中包括有用户对目标主体发起的反馈和发起该反馈的原因,所述目标分析模型包括编码层、双向长短期记忆网络层和条件随机场层,所述编码层用于对文本中的词语进行向量化,所述双向长短期记忆网络层用于提取词语的上下文表示,所述条件随机场层用于输出文本的词语标签;
[0008]根据所述目标分析模型,标注所述目标文本信息中的反馈主体和反馈原因,所述反馈主体和所述反馈原因均包括至少一个词语;
[0009]根据所述反馈主体和反馈原因,从历史反馈单中获取目标反馈单;
[0010]获取该目标反馈单对应的处理结果,并将该目标反馈单和该处理结果推送至目标对象。
[0011]第二方面,本申请提供一种基于序列标注的文本处理装置,包括:
[0012]获取模块,用于获取目标分析模型和目标文本信息,所述目标文本信息中包括有用户对目标主体发起的反馈和发起该反馈的原因,所述目标分析模型包括编码层、双向长短期记忆网络层和条件随机场层,所述编码层用于对文本中的词语进行向量化,所述双向长短期记忆网络层用于提取词语的上下文表示,所述条件随机场层用于输出文本的词语标签;
[0013]标注模块,用于根据所述分析模型,标注所述目标文本信息中的反馈主体和反馈原因,所述反馈主体和所述反馈原因均包括至少一个词语;
[0014]反馈单获取模块,用于根据所述反馈主体和反馈原因,从历史反馈单中获取目标反馈单;
[0015]推送模块,用于获取该目标反馈单对应的处理结果,并将该目标反馈单和该处理结果推送至目标对象。
[0016]第三方面,一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如上述的方法。
[0017]第四方面,一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的方法。
[0018]第五方面,一种计算机程序产品,所述计算机程序产品被处理器执行时用于实现如上述的方法。
[0019]本申请提供的基于序列标注的文本处理方法、装置、设备和介质,通过自动标注出客户反馈单中的反馈主体及反馈原因,降低有人工分析引起判断和处理上的误判,并依据标注出的客户反馈主体及原因结果,对比历史客户反馈,匹配出结果相近的客户反馈单,将结果相近的客户反馈单推荐给反馈单处理人员参考,提高客户反馈单的处理效率。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0021]图1为本申请实施例提供的基于序列标注的文本处理方法的场景示意图;
[0022]图2为本申请实施例提供的基于序列标注的文本处理方法的流程示意图;
[0023]图3为本申请实施例提供的目标分析模型的结构示意图;
[0024]图4为本申请实施例提供的客户反馈情况监控系统流程图;
[0025]图5为本申请实施例提供的基于序列标注的文本处理流程示意图;
[0026]图6为本申请实施例提供的基于序列标注的文本处理装置的结构示意图;
[0027]图7为本申请实施例提供的电子设备的结构示意图。
[0028]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0029]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0030]需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
[0031]需要说明的是,本申请提供的基于序列标注的文本处理方法、装置、设备和介质可用于人工智能
,也可用于除人工智能技术之外的任意领域,本申请提供的基于序
列标注的文本处理方法、装置、设备和介质的应用领域不作限定。
[0032]对于大型的金融机构(例如商业银行),业务量和客户量巨大,每日受理的客户投诉及问题反馈量多达上千笔(通常用户通过填写反馈单来发起投诉和问题反馈,反馈单可以视为一种文本,其中包括有与投诉相关的词语、与反馈原因相关的词语和其它词语(例如与改善建议相关的词语)等)。目前面对大量反馈单,主要采用的是通过人工的方式对反馈单进行分析。目前这种方式效率太低难以提炼出大量有价值的信息,而且其分析客户投诉主体/业务和投诉原因过于依赖主观判断,容易引起判断和处理上的误判(即工作人员有可能不能够从反馈单中准确的提炼出与投诉相关的词语、与问题反馈相关的词语)。而且客户反馈对于大型金融机构的业务优化、提升客户满意度具有重要意义。而且目前面对大量的客户反馈,依赖人工分析不能实时发现客户反馈的变化,及时发现客户需求和产品缺陷,可以为后续的改进和优化产品提供时间保障,从而降低客户投诉率,提升客户体验。
[0033]针对上述问题,本申请实施例提供的一种基于序列标注的文本处理方法、装置、设备和介质,可以准确的提炼出反馈单中的反馈主体(即与投诉主体相关的词语)和反馈原因(即与反馈原因相关的词语)。具体的,通过预先构建目标分析模块,可以自动标注出目标文本信息(即反馈单)中的反馈主题和反馈原因,不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于序列标注的文本处理方法,其特征在于,包括:获取目标分析模型和目标文本信息,所述目标文本信息中包括有用户对目标主体发起的反馈和发起该反馈的原因,所述目标分析模型包括编码层、双向长短期记忆网络层和条件随机场层,所述编码层用于对文本中的词语进行向量化,所述双向长短期记忆网络层用于提取词语的上下文表示,所述条件随机场层用于输出文本的词语标签;根据所述目标分析模型,标注所述目标文本信息中的反馈主体和反馈原因,所述反馈主体和所述反馈原因均包括至少一个词语;根据所述反馈主体和反馈原因,从历史反馈单中获取目标反馈单;获取该目标反馈单对应的处理结果,并将该目标反馈单和该处理结果推送至目标对象。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标分析模型,标注所述目标文本信息中的反馈主体和反馈原因,包括:确定所述目标文本信息中包含的所有词语,所述目标文本信息中包括有N个词语,N为正整数;根据所述目标分析模型,确定每个词语对应的标签,所述标签包括标注结果的类型、标注边界检测的标签,所述标注结果的类型用于表征该词语属于反馈主体或反馈原因,所述标注边界检测的标签用于表征该词语在该标注结果中所处的位置。3.根据权利要求1所述的方法,其特征在于,所述获取目标分析模型,包括:获取训练文本并对所述训练文本进行预处理,得到N个词向量;根据所述词向量,对所述训练文本进行特征提取,得到每个词语的上下文表示;将每个词向量的上下文表示输入条件随机场,得到该训练文本的预测标签序列;根据交叉熵确定所述预测标签序列和真实标签序列的相似度大小;根据所述预测标签序列和真实标签序列的相似度大小,对初始模型进行训练,得到训练后的初始模型作为所述目标分析模型。4.根据权利要求3所述的方法,其特征在于,所述对所述训练文本进行预处理,得到N个词向量,包括:获取历史反馈单;将所述历史反馈单中的词语使用无监督的方法生成预先训练好的词向量文件;将预先训练好的词向量文本映射成词向量矩阵;将所述训练文本中每个词语映射到词向量矩阵中,得到每个词语对应的词向量。5.根据权利要求3所述的方法,其特征在于,所述对所述训练文本进行特征提取,得到每个词向量的上下文表示,包括:将训练文本中的词向量输入至两层双向长短时记忆网络中,获取该词向量经过两层前向长短时记忆网络后得到的前向隐层状态、该词向量经过两层反向长短时记忆网络后得到的反向隐层状态;根据所述前向隐层状...

【专利技术属性】
技术研发人员:李泽南许海光陈军
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1