一种基于深度学习与相似度匹配的知识图谱问答的方法技术

技术编号:28373902 阅读:24 留言:0更新日期:2021-05-08 00:01
本发明专利技术公开了一种基于深度学习与相似度匹配的知识图谱问答的方法,包括,进行启动服务,加载训练好的多标签分类模型;对用户的输入问句进行实体类别的识别;预测出该问句对应的某一个或多个实体标签:云端业务工作室;获取用户问句对应的实体名称:发布需求,并加载该类别下的实体名称词典;根据实体名称构造数据库查询语句;到数据库查询获取答案。本发明专利技术通过利用用户问句数据搭建了基于ALBERT与双向GRU的多标签分类模型,无需对数据进行实体标注,直接识别出用户问句对应的实体标签。区别于现有工作的命名实体识别模型,简化了问答的方法的复杂度与计算量,并且实际测试表明本研究设计的问答的方法具备很高的识别准确度。

【技术实现步骤摘要】
一种基于深度学习与相似度匹配的知识图谱问答的方法
本专利技术涉及知识图谱问答的方法
,具体来说,涉及一种基于深度学习与相似度匹配的知识图谱问答的方法。
技术介绍
随着人们对快速、准确地获取信息的需求越来越大,问答的方法的研究吸引了越来越多的关注。以通过关键词匹配实现信息检索作为主要方法的传统问答技术目前存在一些技术性问题,比如搜索接口不友好、搜索过程复杂、返回信息量大、返回内容针对性不强等,而且无法从根本上解决搜索中存在的准确率低以及召回率低的问题(中国专利CN105868313A[P],一种基于模板匹配技术的知识图谱问答的方法及方法,公开日期:2016-08-17)。随着互联网信息量的爆炸式增长,传统的问答的方法已逐渐无法满足用户的需求。近年来,基于知识图谱的信息检索方式为大数据下的用户搜索拓展了一种新的思路,基于知识图谱的问答的方法成为研究热点。知识图谱是一种具有属性的实体对通过关系链接而成的结构化语义知识库。在知识图谱中,知识通常表示为“三元组”形式的数据结构。知识图谱的出现实现了搜索关键词的的方法化,对每一个关键词都形成一个完整的知识体系,从而提高了搜索质量(中国专利CN109271506A,一种基于深度学习的电力通信领域知识图谱问答的方法的构建方法,公开日期:2019-01-25)。相比于传统的搜索引擎,基于知识图谱的问答的方法具有诸多优点,比如支持更友好的互动问答模式、返回更加精准简洁的搜索结果、支持知识内容的累积与支持实体节点间隐式信息的显示展现等(中国专利CN110532397A,基于人工智能的问答方法、装置、计算机设备及存储介质,公开日期:2019-12-03)。目前,基于知识图谱的问答的方法得到了快速发展。在识别用户问句中的实体名称或者类别时,现有的问答的方法主要采取模板匹配(中国专利CN107729493A,旅行知识图谱的构建方法、装置及旅行问答方法、装置,公开日期:2018-02-23;中国专利CN108846104A,一种基于教育知识图谱的问答分析与处理方法及的方法,公开日期:2018-11-20;中国专利CN108804521A,一种基于知识图谱的问答方法及农业百科问答的方法,公开日期:2018-11-13)。与深度学习(中国专利CN108509519A,基于深度学习的通用知识图谱增强问答交互的方法及方法,公开日期:2018-09-07;中国专利CN108182262A,基于深度学习和知识图谱的智能问答的方法构建方法和的方法,公开日期:2018-06-19;中国专利CN110457442A,面向智能电网客服问答的知识图谱构建方法,公开日期:2019-11-15)两类技术。采用模板匹配需要整理大量的实体词典,而且如果用户问句的用词发生变化,往往会存在匹配不到的问题,造成搜索不到需要的答案;采用深度学习进行命名实体识别,需要对训练数据进行实体标签标注,然后训练模型再进行实体识别,需要较大的计算量。
技术实现思路
针对相关技术中的上述技术问题,本专利技术提出一种基于深度学习与相似度匹配的知识图谱问答的方法,能够克服现有技术方法的上述不足。为实现上述技术目的,本专利技术的技术方案是这样实现的:一种基于深度学习与相似度匹配的知识图谱问答的方法,包括进行启动服务,加载训练好的多标签分类模型;首先对用户的输入问句进行实体类别的识别;预测出该问句对应的某一个或多个实体类别为云端业务工作室,获取用户问句对应的实体名称,并加载该类别下的实体名称词典,根据实体名称构造数据库查询语句;到数据库查询获取答案。进一步地,根据获取到的实体类别,加载该类别下的实体名称词典,如果用户问句中包含词典中的某个实体名称,则返回该实体名称,否则,计算该用户问句与词典中实体名称的余弦相似度,返回匹配相似度最高的实体名称。进一步地,数据库查询获取答案的步骤,步骤包括:数据准备与存储方式;构造训练数据;基于ALBERT与双向GRU的多标签分类模型;获取用户问句对应的节点名称;构造查询语句。进一步地,数据准备的数据源是以某公司网站的客户服务中心作为数据源,包括产品中心,用户中心与活动中心。进一步地,存储方式以产品中心为例,将产品中心下的每个模块作为实体节点的标签,将每个模块下的子模块作为一个实体节点,每个节点包括两个属性分别为name和content,数据存放到图数据库中。进一步地,构造训练数据,是根据用户问句整理得到训练数据集与测试数据集。进一步地,ALBERT与双向GRU的多标签分类模型,是采用ALBERT对训练数据与测试数据的文本进行特征提取,搭建的双向GRU深度学习模型。进一步地,获取用户问句对应的节点名称,将获取到的标签类别加载该标签对应的实体名称词典。进一步地,构造查询语句,使用Neo4j作为存储数据库,构造cypher查询语句,将获取的实体标签与实体名称查询数据库,获取答案。本专利技术的有益效果:通过直接利用用户问句数据搭建了基于ALBERT与双向GRU的多标签分类模型,无需对数据进行实体标注,直接识别出用户问句对应的实体标签。区别于现有工作的命名实体识别模型,本专利技术研究简化了问答的方法的复杂度与计算量,并且实际测试表明本研究设计的问答的方法具备很高的识别准确度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例所述的基于深度学习与相似度匹配的知识图谱问答的方法的问答的方法流程示意图。图2是根据本专利技术实施例所述的基于深度学习与相似度匹配的知识图谱问答的方法的标签云端业务工作室下的数据示意图。图3是根据本专利技术实施例所述的基于深度学习与相似度匹配的知识图谱问答的方法的多标签分类模型的网络结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。根据本专利技术实施例所述的一种基于深度学习与相似度匹配的知识图谱问答的方法,步骤包括:进行启动服务,加载训练好的多标签分类模型;首先对用户的输入问句进行实体类别的识别;预测出该问句对应的某一个或多个实体类别为云端业务工作室,获取用户问句对应的实体名称,并加载该类别下的实体名称词典,根据实体名称构造数据库查询语句;到数据库查询获取答案。为了方便理解本专利技术的上述技术方案,以下通过具体使用方式上对本专利技术的上述技术方案进行详细说明。如图1所示,启动服务后,加载训练好的多标签分类模型,首先对用户的输入问句进行实体类别(label)的识别,预测出用户问句对应的某一个或者多个实体类别,例如问句为用户怎么发布需求,利用本本文档来自技高网
...

【技术保护点】
1.一种基于深度学习与相似度匹配的知识图谱问答的方法,包括以下步骤:/nS1启动服务,加载多标签分类模型;/nS2用户输入问句进行实体类别的识别、预测问句对应的实体标签;/nS3加载该类别下的实体名称词典,获取问句对应的实体名称;/nS4判断问句中是否包含字典中的实体名称,并返回与用户问句相应的实体名称;/nS5根据实体名称与实体标签构造数据库查询语句;/nS6查询图数据库,返回答案。/n

【技术特征摘要】
1.一种基于深度学习与相似度匹配的知识图谱问答的方法,包括以下步骤:
S1启动服务,加载多标签分类模型;
S2用户输入问句进行实体类别的识别、预测问句对应的实体标签;
S3加载该类别下的实体名称词典,获取问句对应的实体名称;
S4判断问句中是否包含字典中的实体名称,并返回与用户问句相应的实体名称;
S5根据实体名称与实体标签构造数据库查询语句;
S6查询图数据库,返回答案。


2.根据权利要求1所述的一种基于深度学习与相似度匹配的知识图谱问答的方法,其特征在于,根据获取到的实体类别,加载该类别下的实体名称词典,如果用户问句中包含词典中的某个实体名称,则返回该实体名称,否则,计算该用户问句与词典中实体名称的余弦相似度,返回匹配相似度最高的实体名称。


3.根据权利要求1所述的一种深度学习与相似度匹配的知识图谱问答的方法,所述数据库查询获取答案的步骤包括:数据准备与存储方式;构造训练数据;基于ALBERT与双向GRU的多标签分类模型;获取用户问句对应的节点名称;构造查询语句。


4.根据权利要求3所述的一种深度学习与相似度匹配的知识图谱问...

【专利技术属性】
技术研发人员:李小超张晶亮谢水庚胡博钦郝志强
申请(专利权)人:北京航天云路有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1