【技术实现步骤摘要】
运营商智能定责方法及装置
[0001]本申请涉及深度学习领域,具体为一种基于BERT+CRF的贝叶斯神经网络的运营商智能定责方法及装置。
技术介绍
[0002]在运营商客服作业流程中,产生了大量的客户反馈意见,每天需要花费大量的人力物力进行意见的原因追踪和定责,对这些客户的投诉工单进行传统的人工定责时,需要花费大量的人力、物力和时间,且人工的定责效率较低。
[0003]关键词提取从最早期开始,主要是基于词典与规则的方法,它们依赖于语言学家的手工构造的规则模板,容易产生错误,不同领域间无法移植。因此,这种方法只能处理一些简单的文本数据,对于复杂非结构化的数据却无能为力。随后主要是基于统计机器学习的方法,这些方法包括隐马尔可夫模型(HMM)、最大熵模型(MEM)、支持向量机(SVM)和条件随机场(CRF)等。但是这些方法在特征提取方面仍需要大量的人工参与,且严重依赖于语料库,识别效果并非很理想。
[0004]所以,近些年来,深度学习被应用到中文关键词提取研究上。基于深度学习的方法,是通过获取数据的特征和分布式表示,避免繁琐的人工特征抽取,具有良好的泛化能力。深度学习出现了许多这个领域的研究,如LSTM
‑
CRF、BiLSTM
‑
CRF、CNN
‑
CRF和CNN
‑
BiLSTM
‑
CRF等许许多多神经网络模型,这些模型都在关键词提取上展现出了很好的效果。
[0005]然而,以上方法存在这样的一个问题:这些方法无
【技术保护点】
【技术特征摘要】
1.一种基于BERT+CRF的贝叶斯神经网络的运营商智能定责方法,其特征在于,所述方法包括步骤:S1:获取通信运营商的投诉工单语料库,基于所述投诉工单语料库对工单进行数据清洗,得到清洗好的工单;S2:将清好的工单输入至BERT模型,得到训练数据的词向量;S3:采用CRF算法对词向量进行特征提取,得到特征词序列;S4:将特征词序列输入贝叶斯神经网络模型进行训练,调优参数,形成问题根因分析模型;S5:根据问题根因分析模型对待定责的工单进行分析,确定责任归属。2.根据权利要求1所述的运营商智能定责方法,其特征在于,所述获取通信运营商的投诉工单语料库,基于所述投诉工单语料库对工单进行数据清洗,得到清洗好的工单包括:获取工单数据的产品类型、服务类型和服务内容;对产品类型和服务类型进行规范化处理,使用下划线符号替换产品类型和服务类型中的正斜杠符号,使用连字符拼接产品类型和服务类型,生成工单类型;对服务内容进行文本预处理,将所有的字母转换为小写,并使用Tokenizer对文本进行处理,得到处理后的数据;将处理后的数据进行ecode处理,将处理后的数据转变为词嵌入、类型嵌入和位置嵌入,得到清洗好的工单。3.根据权利要求1所述的运营商智能定责方法,其特征在于,所述BERT模型采用双向Transformer作为编码器,以融合字左右两侧的上下文;其中,Transformer采用了多头模式,以扩展模型专注于不同位置,增大注意力单元的表示子空间。4.根据权利要求3所述的运营商智能定责方法,其特征在于,所述BERT模型的编码单元中加入残差网络,如下式所示:其中,为经过残差网络后的输出,h
i
为不加入残差网络时多头注意力机制的输出,u
i
为多头注意力机制的输入;按照如下公式计算多头注意力机制的输出,如下式所示:按照如下公式计算多头注意力机制的输出,如下式所示:Transformer结构中的全链接前馈网络有两层dense,其中,第一层的激活函数是ReLU,第二层是一个线性激活函数,其中,为多头注意力机制的输出,b是偏置向量,FNN是全链接前馈馈网络。5.根据权利要求1所述的运营商智能定责方法,其特征在于,所述采用CRF算法对词向量进行特征提取,得到特征词序列包括:将BERT模型的输出作为CRF模块的输入,CRF能通过邻近标签的关系获得一个最优的预测序列,其中,给定条件随机场的观测序列f=f1,f2,
…
,f
n
,状态序列y=y1,y2,
…
,y
n
,y
i
∈{B,I,O};
其中,在CRF模块中,给定观测序列f和状态序列y的条件概率分布如式所示:其中,在CRF模块中,给定观测序列f和状态序列y的条件概率分布如式所示:其中,ω
j
为特征函数,γ(f)指所有可能的状态序列,和分别为权...
【专利技术属性】
技术研发人员:马晓亮,安玲玲,邓从健,杜德泉,朱栩,宋灿辉,张志青,王嘉豪,
申请(专利权)人:广州云趣信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。