一种基于知识图谱的热线工单智能分派方法技术

技术编号:37571966 阅读:13 留言:0更新日期:2023-05-15 07:50
本发明专利技术公开了一种基于知识图谱的热线工单智能分派方法,属于工单派发领域。本发明专利技术采用自然语言处理技术对工单文本的事件描述进行事件提取,获取热线事件的触发词、事件角色内容,从而得到事件文本的关键信息,这些热线事件的关键信息作为构建知识图谱的基础信息,根据热线事件提取得到的“事件

【技术实现步骤摘要】
一种基于知识图谱的热线工单智能分派方法


[0001]本专利技术涉及工单派发
,更具体地说,涉及一种基于知识图谱的热线工单智能分派方法。

技术介绍

[0002]市长热线工单(以下简称“工单”)是接线员根据市民来电所记录的文本信息,其要素为时间、地点、人物、事件。工单文本信息在空间序列上呈现出楼宇、小区、社区、街道的逐层扩散特征,在主题序列上通常覆盖城市生活各个方面的连续扩展特征。接线员对于工单需要寻找拟分派的责任部门,而可选的责任部门通常多达几十个,确认责任部门的环节费时费力。此外,人工工单分派准确与否依赖于接线员对市民诉求分类的准确判断和对各责任部门职能的深入了解。在市长热线运营实践中,错误派单时常发生,造成了不必要的二次分派。随着市长热线受理的城市事件种类越来越庞杂、数量越来越多,工单智能分派势在必行。
[0003]为了实现市长热线工单自动分派,一般采用基于机器学习的方法:首先从工单文本描述中提取特征,然后将多个特征串联起来组成一个高维度的特征向量,最后使用分类器完成分类。这种方法需要做大量的特征工程,特征的选取和分析方式复杂,导致花费大量精力去构思出来的特征可能与指定的任务不相关。更进一步,可以使用卷积神经网络(CNN,Convolutional Neural Networks)、循环神经网络(RNN,Recurrent Neural Network)、长短期记忆循环神经网络(LSTM,Long Short

Term Memory)自动完成工单文本特征提取和分类任务。然而,属于同一大类但不同小类的工单在文本信息描述上具有很多相似性。例如,同属于“街面秩序”类下的“占道停车”和“占道修车”的描述非常类似,但却归属不同的责任部门(公安局和城管局),利用单一神经网络的方法很难发现这种微小的差异,较难判断所归属的责任部门。
[0004]经检索,公开号CN112541351A的专利公开了一种住建领域政务热线工单派发方法及系统,通过对住建领域政府热线工单文本进行分词构建文档词条矩阵,输入预训练的支持向量机模型来预测工单的责任单位。该方法仅能适用于住建部门相关工单,无法适用于其他部门。

技术实现思路

[0005]1.专利技术要解决的技术问题
[0006]针对现有技术中热线工单人工分派准确性有所欠缺的情况,本专利技术拟提供一种基于知识图谱的热线工单智能分派方法,有助于提升热电工单分派准确性,更好的实现“接诉即办”。
[0007]2.技术方案
[0008]为达到上述目的,本专利技术提供的技术方案为:
[0009]本专利技术的一种基于知识图谱的热线工单智能分派方法,采用自然语言处理技术对
工单文本的事件描述进行事件提取,获取热线事件的触发词、事件角色内容,从而得到事件文本的关键信息,这些热线事件的关键信息作为构建知识图谱的基础信息。事件提取结果主要包含“事件

事件类型”、“事件

触发词”、“事件

事件角色”等信息,根据这些信息构建事件三元组,然后使用实体融合、关系发现与关系推理等知识图谱相关技术将这些三元组进行融合关联,以此构建事件关键信息的知识图谱。根据热线事件提取得到的“事件

事件类型”、“事件

触发词”、“事件

事件角色”等信息,根据事件的关键信息设计多个问题,结合该关键信息实体在知识图谱中的信息并使用答案选择的方法来获取该事件的候选分派部门。
[0010]部门分派的关键是对工单文本内容本身的分析以及挖掘工单文本中事件与政府部门之间的关系,本专利技术提出的基于事件提取和知识图谱的热线工单智能分派方法包含三个主要部分:S100、基于历史热线工单文本的事件提取;S200、基于事件关键信息的知识图谱构建;S300、基于知识图谱问答的分派部门预测。
[0011]其中S100中热线工单文本事件提取技术包含事件检测和事件角色识别两个部分,其中事件检测过程如下:
[0012]S111、对事件文本进行句子分割,并使用jieba分词进行分词处理得到documenttokens和sentencetokens;
[0013]S112、使用词嵌入方法对documenttokens进行编码,然后使用CNN网络和RNN网络分别提取热线事件文本的局部特征与全局特征,然后结合Attention机制,得到热线事件文本的表示向量V1;
[0014]S113、对sentencetokens进行词嵌入处理,并使用AMR算法对每个句子生成AMR图,结合关键词、AMR根节点等方式连接多个AMR图得到事件文本整体AMR图,使用GCN网络编码AMR图,得到热线事件文本的表示向量V2;
[0015]S114、使用BERT预训练语言模型处理热线事件文本的每个句子,生成句子中所有词的词向量,然后使用SIF权重将词向量组成多个句向量,根据文本的内容层次分布,(如文章的中心内容主要集中在第一句或最后一句,句子长度等),使用加权平均的方法将多个句向量组合成热线事件文本的表示向量V3;
[0016]S115、采用门控机制融合三种类型的表示向量V1,V2,V3,得到对应的融合向量V
fuse
,最后使用全连接网络对融合向量进行事件多标签分类和事件触发词识别,得到对应的多标签事件类型以及触发词集合。
[0017]事件角色识别过程如下:
[0018]S121、将对事件文本进行jieba分词处理得到分词结果,并使用词嵌入方式进行处理得到对应的编码结果;
[0019]S122、使用BiLSTM+CRF模型对编码后的结果进行命名实体识别,识别出热线事件文本中所有的实体向量;
[0020]S123、对于不同事件类型,首先根据embedding表找到其对应触发词的embedding向量,并使用BiLSTM网络进行编码,得到事件触发词表示向量V
t

[0021]S124、拼接事件类型对应的触发词表示向量V
t
和实体向量,计算不同事件类型的事件角色。
[0022]S200中基于历史热线工单分派结果,可以得到事件处理部门、事件结果等信息,根
据事件提取算法结果可以得到热线事件的触发词、事件类型、事件角色等信息,以事件编号、部门名称、事件类型名称等实体作为节点可以得到多个三元组:
[0023]“事件

处理部门

部门名”,“事件

处理

处理方式”,“事件

事件类型

事件类型名称”,“事件

触发词

触发词名称”,“事件

事件角色

角色内容”;
[0024]这些三元组可以得到某个历史事件的关系图,将这些事件关系图连接起来得到热线工单事件的知识图谱,其中同一事件可以关联多个类型、多个触本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的热线工单智能分派方法,其特征在于:包括:S100、基于历史热线工单文本的事件提取;S200、基于事件关键信息的知识图谱构建;S300、基于知识图谱问答的分派部门预测。2.根据权利要求1所述的一种基于知识图谱的热线工单智能分派方法,其特征在于:S100中热线工单文本事件提取技术包含事件检测,事件检测过程如下:S111、对事件文本进行句子分割,并使用jieba分词进行分词处理得到documenttokens和sentencetokens;S112、使用词嵌入方法对documenttokens进行编码,然后使用CNN网络和RNN网络分别提取热线事件文本的局部特征与全局特征,然后结合Attention机制,得到热线事件文本的表示向量V1;S113、对sentencetokens进行词嵌入处理,并使用AMR算法对每个句子生成AMR图,连接多个AMR图得到事件文本整体AMR图,使用GCN网络编码AMR图,得到热线事件文本的表示向量V2;S114、使用BERT预训练语言模型处理热线事件文本的每个句子,生成句子中所有词的词向量,然后使用SIF权重将词向量组成多个句向量,根据文本的内容层次分布,使用加权平均的方法将多个句向量组合成热线事件文本的表示向量V3;S115、采用门控机制融合三种类型的表示向量V1,V2,V3,得到对应的融合向量V
fuse
,最后使用全连接网络对融合向量进行事件多标签分类和事件触发词识别,得到对应的多标签事件类型以及触发词集合。3.根据权利要求2所述的一种基于知识图谱的热线工单智能分派方法,其特征在于:S100中热线工单文本事件提取技术还包含事件角色识别,事件角色识别过程如下:S121、将对事件文本进行jieba分词处理得到分词结果,并使用词嵌入方式进行处理得到对应的编码结果;S122、使用BiLSTM+CRF模型对编码后的结果进行命名实体识别,识别出热线事件文本中所有的实体向量;S123、对于不同事件类型,首先根据embedding表找到其对应触发词的embedding向量,并使用BiLSTM网络进行编码,得到事件触发词表示向量V
t
;S124、...

【专利技术属性】
技术研发人员:陈钢佘祥荣陈健鹏孔海春
申请(专利权)人:长三角信息智能创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1