一种基于知识图谱的多意图识别系统、方法、设备及介质技术方案

技术编号:21628976 阅读:58 留言:0更新日期:2019-07-17 11:06
本发明专利技术公开了一种基于知识图谱的多意图识别系统、方法、设备及介质,包括:知识图谱,用于为图计算和推理提供数据基础;实体识别模块,用于基于所述知识图谱,从用户输入文本中识别出文本实体和文本属性;图计算模块,用于基于所述知识图谱、所述实体识别模块输出的文本实体和文本属性,进行图计算,识别用户问题;交互模块,用于调用所述图计算模块,获取所述用户问题,从知识库中进行答案召回和生成。本发明专利技术根据知识图谱自动进行多意图识别,不局限于标点、句式和句法分析,用户意图不清时,通过自动反问实现意图收敛,有效提高问题识别率和准确率,极大提升问答机器人的灵活性,对话自然。

A Knowledge Map-based Multi-Intention Recognition System, Method, Equipment and Media

【技术实现步骤摘要】
一种基于知识图谱的多意图识别系统、方法、设备及介质
本专利技术涉及计算机问答
,具体涉及一种基于知识图谱的多意图识别系统、方法、设备及介质。
技术介绍
目前在问答领域,传统的多意图识别采用简单的基于标点句子切分,或结合句法分析,如“什么叫正当防卫?防卫过当要判多少年?”基于问好、句号、叹号等标点,可以切分成两个问题“什么是正当防卫”、“防卫过当要判多少年”,根据切分后的问题,分别在知识库中通过相似匹配召回;再如“杀人违法吗?判多少年?”可以切分为“杀人违法吗”、“判多少年”,此时切分后的问题通过句法分析可知后面一句缺少主语,现有技术中做的比较好的问答系统可以从前一句提取主语,并通过模型判断主语是否应该补全。可见,现有技术对多意图识别要求提问者能够使用正确的语法表达,甚至使用正确的标点,而在实际对话问答中,由于提问者的水平参差不齐,且口语随意性较强,可能有更多缺失的内容,语法错误也较多,存在提问意图不清的情况,通过标点和句式句法分析很难正确识别其中意图。
技术实现思路
针对上述问题,本专利技术提供一种基于知识图谱的多意图识别系统、方法、设备及介质,在对用户问题进行多意图识别和切分过程中,基于消歧模型对不确定意图进行自动反问,实现意图收敛,有效提高问题识别率和准确率,极大提升问答机器人的灵活性,对话自然。本专利技术具体为:一种基于知识图谱的多意图识别系统,包括:知识图谱,用于为图计算和推理提供数据基础;实体识别模块,用于基于所述知识图谱,从用户输入文本中识别出文本实体和文本属性;图计算模块,用于基于所述知识图谱、所述实体识别模块输出的文本实体和文本属性,进行图计算,识别用户问题;交互模块,用于调用所述图计算模块,获取所述用户问题,从知识库中进行答案召回和生成。进一步地,所述知识图谱根据行业进行建立,不同行业分别对应不同的知识图谱;所述知识图谱建立完成后,以RDF形式存储于图数据库中。进一步地,所述实体识别模块还用于:判断从用户输入文本中识别出的文本实体是否有歧义,若是则基于消歧模型计算出歧义分类及歧义概率,并自动生成消歧问题向用户反问,根据用户回答对所述文本实体进行消歧处理;否则不做处理。进一步地,所述图计算模块进行图计算,识别用户问题,具体包括:对所述文本实体和文本属性进行路径计算,当路径中缺失节点时,对所述节点进行自动补全,得到完整路径,确保路径连通性;按照路径进行意图切分,识别出用户问题。一种基于知识图谱的多意图识别方法,包括:基于知识图谱,从用户输入文本中识别出文本实体和文本属性;基于所述知识图谱、文本实体和文本属性,进行图计算,识别用户问题;根据所述用户问题,从知识库中进行答案召回和生成。进一步地,所述知识图谱根据行业进行建立,不同行业分别对应不同的知识图谱;所述知识图谱建立完成后,以RDF形式存储于图数据库中。进一步地,所述从用户输入文本中识别出文本实体和文本属性后,还包括:判断从用户输入文本中识别出的文本实体是否有歧义,若是则基于消歧模型计算出歧义分类及歧义概率,并自动生成消歧问题向用户反问,根据用户回答对所述文本实体进行消歧处理;否则不做处理。进一步地,所述进行图计算,识别用户问题,具体包括:对所述文本实体和文本属性进行路径计算,当路径中缺失节点时,对所述节点进行自动补全,得到完整路径,确保路径连通性;按照路径进行意图切分,识别出用户问题。一种电子设备,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行上述基于知识图谱的多意图识别方法。一种计算机可读存储介质,存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述基于知识图谱的多意图识别方法。本专利技术的有益效果体现在:本专利技术针对用户提问的输入文本,根据知识图谱自动进行多意图识别,不局限于标点、句式和句法分析,且对意图自动进行切分,并进行答案生成;用户意图不清时,可在自行推理后,通过自动反问实现意图收敛,有效提高问题识别率和准确率,极大提升问答机器人的灵活性,对话自然。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。图1为本专利技术实施例一种基于知识图谱的多意图识别系统结构图;图2为本专利技术实施例一种知识图谱示意图;图3为本专利技术实施例一种图计算过程中的路径示意图;图4为本专利技术实施例一种基于知识图谱的多意图识别方法流程图;图5为本专利技术实施例另一种基于知识图谱的多意图识别方法流程图;图6为本专利技术实施例一种电子设备结构示意图。具体实施方式下面将结合附图对本专利技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,因此只作为示例,而不能以此来限制本专利技术的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。如图1所示,为本专利技术一种基于知识图谱的多意图识别系统实施例,包括:知识图谱11,用于为图计算和推理提供数据基础;实体识别模块12,用于基于所述知识图谱,从用户输入文本中识别出文本实体和文本属性;图计算模块13,用于基于所述知识图谱、所述实体识别模块输出的文本实体和文本属性,进行图计算,识别用户问题;交互模块14,用于调用所述图计算模块,获取所述用户问题,从知识库中进行答案召回和生成。优选地,所述知识图谱根据行业进行建立,不同行业分别对应不同的知识图谱;所述知识图谱建立完成后,以RDF形式存储于图数据库中;以证券行业为例,给出一种知识图谱示意图,如图2所示。优选地,所述实体识别模块还用于:判断从用户输入文本中识别出的文本实体是否有歧义,若是则基于消歧模型计算出歧义分类及歧义概率,并自动生成消歧问题向用户反问,根据用户回答对所述文本实体进行消歧处理;否则不做处理。例如,用户输入文本,即用户提问“我想买平安,怎么买”,系统识别出文本实体“平安”,属性“购买”;通常情况下,平安可能是平平安安的意思,在证券领域,平安是中国平安的别称,但是基于证券行业知识图谱,该文本实体没有歧义,无需消歧;基于知识图谱,进一步识别出中国平安这个股票实例分别属于港股和A股两个概念下,这两个概念均为股票的子概念,因此该用户问题的识别结果为:实体:中国平安[isa港股,isaA股],港股[isa股票],A股[isa股票]属性:购买由于港股和A股同属于股票,系统无法自动消歧,因此自动生成消歧问题向用户反问:请问是购买中国平安[02318.HK]还是中国平安[601318]?最后根据用户回答,来确定文本实体具体属于哪个概念实体。优选地,所述图计算模块进行图计算,识别用户问题,具体包括:对所述文本实体和文本属性进行路径计算,当路径中缺失节点时,对所述节点进行自动补全,得到完整路径,确保路径连通性;按照路径进行意图切分,识别出用户问题。一般情况下,用户输入文本的一个问题可本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的多意图识别系统,其特征在于,包括:知识图谱,用于为图计算和推理提供数据基础;实体识别模块,用于基于所述知识图谱,从用户输入文本中识别出文本实体和文本属性;图计算模块,用于基于所述知识图谱、所述实体识别模块输出的文本实体和文本属性,进行图计算,识别用户问题;交互模块,用于调用所述图计算模块,获取所述用户问题,从知识库中进行答案召回和生成。

【技术特征摘要】
1.一种基于知识图谱的多意图识别系统,其特征在于,包括:知识图谱,用于为图计算和推理提供数据基础;实体识别模块,用于基于所述知识图谱,从用户输入文本中识别出文本实体和文本属性;图计算模块,用于基于所述知识图谱、所述实体识别模块输出的文本实体和文本属性,进行图计算,识别用户问题;交互模块,用于调用所述图计算模块,获取所述用户问题,从知识库中进行答案召回和生成。2.如权利要求1所述的系统,其特征在于,所述知识图谱根据行业进行建立,不同行业分别对应不同的知识图谱;所述知识图谱建立完成后,存储于图数据库中。3.如权利要求2所述的系统,其特征在于,所述实体识别模块还用于:判断从用户输入文本中识别出的文本实体是否有歧义,若是则基于消歧模型计算出歧义分类及歧义概率,并自动生成消歧问题向用户反问,根据用户回答对所述文本实体进行消歧处理;否则不做处理。4.如权利要求3所述的系统,其特征在于,所述图计算模块进行图计算,识别用户问题,具体包括:对所述文本实体和文本属性进行路径计算,当路径中缺失节点时,对所述节点进行自动补全,得到完整路径;按照路径进行意图切分,识别出用户问题。5.一种基于知识图谱的多意图识别方法,其特征在于,包括:基于知识图谱,从用户输入文本中识别出文本实体和文本属性;基于所述知识图谱、文本实体和文本属性,进行图计算,识别用户问题;根据所述用户问题,从知识库中进行答...

【专利技术属性】
技术研发人员:柴志伟曾诤谢珉王祖龙
申请(专利权)人:宁波深擎信息科技有限公司上海深擎信息科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1