【技术实现步骤摘要】
一种基于深度学习的知识库问答方法
本专利技术涉及计算机问答系统
,具体涉及一种基于深度学习的知识库问答方法。
技术介绍
近年来,随着科技的不断创新,人工智能也取得了突飞猛进的发展。自动问答系统作为人工智能的一个重要分支领域也受到了越来越多的关注。网络信息的指数增长成为了互联网发展的必然趋势。面对如此庞大的信息量的增长,怎样快速提取用户所需要的有效信息将变得十分重要。搜索引擎技术的出现很大程度上满足了人们对信息获取的需求。搜索引擎也逐渐成为人们获取知识,筛选信息的便捷途径。但是传统的搜索引擎根据用户的问题返回的是一系列的网页或者文档,而不是直接返回用户所需要的答案。问答系统就是为了解决用户的这种需求而出现的。用户将需求的问题用自然语言的方式输入给问答系统,问答系统快速的将最准确的答案返回给用户。问答系统将会是下一代搜索引擎的基本形态。知识库问答是自动问答的一种。知识库又称为知识图谱,是一种用于存储大规模的结构化知识的数据库系统。通常知识库中结构化的知识可以用三元组的形式表示,即(subject,predicate ...
【技术保护点】
1.一种基于深度学习的知识库问答方法,其特征在于,包括以下步骤:/n步骤1:基于主题实体识别SAMM模型,对用户的自然语言问句进行主题实体识别,识别出多个主题实体;/n步骤2:根据所述多个主题实体进行权重赋值,获得不同权重的多个中心实体;/n步骤3:基于属性关系检测MGQR模型,根据所述不同权重的多个中心实体,选出候选答案路径,并计算出用户的自然语言问句和所述候选答案路径的相似度总分;/n步骤4:根据所述相似度总分,对所述候选答案路径进行排序权重,获得不同权重的多个候选答案路径;/n步骤5:基于线性函数,对所述不同权重的多个中心实体和所述不同权重的多个候选答案路径进行函数匹 ...
【技术特征摘要】
1.一种基于深度学习的知识库问答方法,其特征在于,包括以下步骤:
步骤1:基于主题实体识别SAMM模型,对用户的自然语言问句进行主题实体识别,识别出多个主题实体;
步骤2:根据所述多个主题实体进行权重赋值,获得不同权重的多个中心实体;
步骤3:基于属性关系检测MGQR模型,根据所述不同权重的多个中心实体,选出候选答案路径,并计算出用户的自然语言问句和所述候选答案路径的相似度总分;
步骤4:根据所述相似度总分,对所述候选答案路径进行排序权重,获得不同权重的多个候选答案路径;
步骤5:基于线性函数,对所述不同权重的多个中心实体和所述不同权重的多个候选答案路径进行函数匹配计算,获得最终答案并反馈给用户。
2.如权利要求1所述的基于深度学习的知识库问答方法,其特征在于,所述主题实体识别还包括以下步骤:
步骤1.1:将用户的自然语言问句进行分词拼接,获得拼接后的用户问句;
步骤1.2:对所述拼接后的用户问句进行上下文信息提取,获得含有上下文信息的语义特征;
步骤1.3:根据所述含有上下文信息的语义特征进行特征识别,识别出多个主题实体。
3.如权利要求2所述的基于深度学习的知识库问答方法,其特征在于,所述分词拼接还包括以下步骤:
步骤1.1.1:将用户的自然语言问句进行分词和更新,得到用户问句;
步骤1.1.2:基于自注意力机制,计算所述用户问句中任意两个词向量之间的依赖关系,获得所述用户问句的自注意交互矩阵;
步骤1.1.3:将所述用户问句与所述自注意交互矩阵进行拼接,获得拼接后的用户问句。
4.如权利要求2所述的基于深度学习的知识库问答方法,其特征在于,所述特征识别还包括以下步骤:
步骤1.3.1:将所述含有上下文信息的语义特征输入条件随机场CRF,获得标注后的问句序列;
步骤1.3.2:根据所述标注后的问句序列,识别出多个主题实体。
5.如权利要求1所述的基于深度学习的知识库问答方法,其特征在于,所述权重赋值还包括以下步骤:
步骤2.1:根据所述多个主题实体的排序顺序,从中选出排序靠前的多个主题实体;
步骤2.2:对所述排序靠前的多个主题实体分别赋予不同的权重,获得不同权重的多个主题实体,作为所述不同权重的多个中心实体。
6.如权利要求1所述的基于深度学习的知识库问答方法,其特征在于,计算所述相似度总分还包括以下步骤:
步骤3.1:对所述候选答案路径中字、词和实体关系进行粒度向量表示,分别获得所述候选答案路径的字粒度向量、词粒度向量和实体关系粒度向量;
步骤3.2:根据所述字粒度向量、所述词粒度向量和所述实体关系粒度向量进行语义特征提...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。