一种基于知识图谱问答的热线分拨方法技术

技术编号:38929694 阅读:29 留言:0更新日期:2023-09-25 09:35
本发明专利技术涉及人工智能技术领域,具体涉及一种基于知识图谱问答的热线分拨方法,通过利用事件提取模型来获取事件的关键信息以构建历史事件知识图谱,根据事件提取获取的事件触发词、事件类型以及事件角色并进行子图检索,并结合fusion

【技术实现步骤摘要】
一种基于知识图谱问答的热线分拨方法


[0001]本专利技术涉及人工智能
,尤其涉及一种基于知识图谱问答的热线分拨方法。

技术介绍

[0002]近年来,热线诉求涉及城市治理的各个方面,在来电主题上覆盖社会治理的各个方面,如大气污染、医疗保险、噪音扰民、车辆停车、物业服务和消费纠纷等事件。为高效实现热线分拨,接线员不但要充分理解反映的事件,还要对各部门职能有深入的了解。在缺乏专业培训的情况下,接线员很难从几十个处置部门中挑选正确的部门完成热线分拨,这就导致了人工分拨的准确率不高(即错误派单),造成大量的二次分拨。一些相对复杂的诉求可能需要跨部门协同处理,因此错误的分拨不利于热线的权威性和执行力。
[0003]专利CN113919811B提出了基于强化关联的热线事件分拨方法。这种方法存在如下问题:(1)对于每一个热线文本都需要构建事件画像,无法将历史热线文本所形成的事件画像用于新的热线文本,即事件画像无法沉淀为知识;(2)虽然“三定”信息对于热线分拨起到了一定作用,但由于问题(1)的存在,将其与事件画像进行强化关联存在不确定性,即在某些本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱问答的热线分拨方法,其特征在于,包括以下步骤:S1、将输入事件文本采用事件提取算法获取事件触发词、事件类型和事件论元角色;S2、使用历史事件数据中对应的事件编号信息与处置部门信息,结合事件触发词、事件类型和事件论元角色,建立关系模式图;S3、通过知识融合将关系模式图中的信息进行整合,针对每个事件中对应的三元组信息,构建n张子图,并对其中的重复实体进行融合,建立子图之间的联系,形成完整的知识图谱;S4、使用基于知识图谱的子图检索得到最终子图G,使用基于“三定”职责的文本检索得到文本检索结果;S5、对最终子图G和文本检索结果进行事件关联特征提取,分别得到图表示向量和
ꢀ“
三定”职责文本的特征表示向量,并将事件文本特征结合子图中的部门实体集合生成融合事件向量集;S6、通过图表示向量和
ꢀ“
三定”职责文本的特征表示向量,对融合事件向量集中的所有元素进行部门得分预测,输出最优分拨部门。2.根据权利要求1所述的基于知识图谱问答的热线分拨方法,其特征在于,步骤S1中,获取事件触发词的步骤包括:使用中文分词工具对输入事件文本进行分词,得到一系列词序列,其中n为分词得到的词序列长度;使用word2vec编码模型对词序列进行初始化编码,得到对应的初始化语义编码向量,针对每个词,构建对应的位置向量与段向量;将初始化编码向量、位置向量与段向量一同输入预训练语言模型中,得到对应的语义编码向量,语义编码向量构成集合;构建分类器模型,将词序列语义编码向量中的向量依次输入分类器,得到对应的触发器概率分布,其中,为可学习的参数;得到序列的分类概率分布后,选取概率分布中top

n对应的词序列作为最终的事件触发词预测结果;使用交叉熵损失函数对预测进行优化:其中表示实际触发词分类结果,表示预测的触发词分类结果。3.根据权利要求2所述的基于知识图谱问答的热线分拨方法,其特征在于,步骤S1中,获取事件类型的具体步骤包括:对触发词序列中的触发词对应的语义向量编码进行融合,输入到多分类网络中,得到对应的事件类型概率分布,并选择其中概率最高的结果作为对事件类型的预测结果:
其中,,为可学习的参数,表示最大池化运算,分别取每个维度对应的最大值;事件分类采用交叉熵函数进行优化。4.根据权利要求2所述的基于知识图谱问答的热线分拨方法,其特征在于,步骤S1中,获取事件论元角色具体包括以下步骤:根据触发词序列生成结果,构建对应的关键信息位置向量;将语义编码向量构成的集合与对应的位置向量、关键信息位置向量一同输入预训练语言模型,得到相应的编码向量,将编码结果与事件类型编码一同送入论元分类器中,生成对应的论元角色分布概率其中,为可学习的参数,事件类型编码根据事件类型模块的生成结果构建,为一维向量;得到概率分布后,选取概率topn对应的概率进行计算,若前n个分布概率分布类似时,则同时输出n分类结果,否则只输出概率最高的分类结果;论元角色提取采用多分类交叉熵函数进行优化:其中为论元角色数量,为符号函数,如果样本的真实类别等于则取1,否则取0,表示对样本预测结果类别为的概率。5.根据权利要求1所述的基于知识图谱问答的热线分拨方法,其特征在于,步骤S3具体包括:实体消歧:基于关系模式图中任意两个同名实体构成的实体对,将两个实体与其周围的事件文本进行关联后,输入预训练语言模型得到对应的向量编码;计算两个实体之间的语义相似度,将相似度大于一定阈值的实体构成和集合进行合并,对存在不同指代的同名实体做出区分其中表示对某一实体的向量编码,表示实体向量的编码长度;
共指消解:利用预训练语言模型对论元及所在的句子进行编码,并对生成的两个向量进行融合,构成对某一论元角色的融合编码。而后对论元角色融合编码进行聚类,并在聚合在同一簇中的论元融合向量集中计算融合向量相似度...

【专利技术属性】
技术研发人员:水新莹王永璋孔慧宇陈钢
申请(专利权)人:长三角信息智能创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1