基于知识图谱的智能问答方法、装置和计算机设备制造方法及图纸

技术编号:24206527 阅读:73 留言:0更新日期:2020-05-20 14:54
本申请揭示了一种基于知识图谱的智能问答方法、装置、计算机设备和存储介质,所述方法包括:获取问句,并对问句进行预处理,从而得到关键词序列;计算关键词序列与预设的知识图谱索引的相似度值;若相似度值不大于预设的相似度阈值,则判断是否存在可拆分的指定名词;若存在可拆分的指定名词,则将所述关键词序列中的指定名词拆为分多个逻辑分词;判断所述知识图谱中是否存在指定网络结构,所述指定网络结构指第一实体‑第一实体关系‑第二实体‑第二实体关系‑···‑第n‑1实体关系‑第n实体的网络结构;若知识图谱中存在指定网络结构,则将第n实体关系作为答案,或者将第n+1实体作为答案;并输出所述答案。从而提高了问题回答的准确率。

Intelligent question answering method, device and computer equipment based on Knowledge Map

【技术实现步骤摘要】
基于知识图谱的智能问答方法、装置和计算机设备
本申请涉及到计算机领域,特别是涉及到一种基于知识图谱的智能问答方法、装置、计算机设备和存储介质。
技术介绍
传统的基于faq(常见问题解答)对的问答方法,是基于问答对的一问一答,通过客户的输入语句,进行相似度计算后匹配最相似语句,然后获取该语句对应的答案。但是这种问答仅限于已有答案的faq(常见问题解答)对,对于存在逻辑问答类的提问将会回答错误。因此传统的问答方法的准确度有待提高。
技术实现思路
本申请的主要目的为提供一种基于知识图谱的智能问答方法、装置、计算机设备和存储介质,旨在提高了问题回答的准确率。为了实现上述专利技术目的,本申请提出一种基于知识图谱的智能问答方法,包括以下步骤:获取问句,并对所述问句进行预处理,从而得到关键词序列,其中所述预处理至少包括词性标注,所述关键词序列至少包括通过所述词性标注得到的名词;根据预设的相似度计算方法,计算所述关键词序列与预设的知识图谱索引的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述知识图谱索引本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的智能问答方法,其特征在于,包括:/n获取问句,并对所述问句进行预处理,从而得到关键词序列,其中所述预处理至少包括词性标注,所述关键词序列至少包括通过所述词性标注得到的名词;/n根据预设的相似度计算方法,计算所述关键词序列与预设的知识图谱索引的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述知识图谱索引包括主语、谓语和宾语三者中的二者,所述主语、谓语和宾语均记载于所述知识图谱中;/n若所述相似度值不大于预设的相似度阈值,则通过查询预设的可拆分名词库,从而判断所述关键词序列中是否存在可拆分的指定名词;/n若所述关键词序列中存在可拆分的指定名词,则根据预设的名词拆...

【技术特征摘要】
1.一种基于知识图谱的智能问答方法,其特征在于,包括:
获取问句,并对所述问句进行预处理,从而得到关键词序列,其中所述预处理至少包括词性标注,所述关键词序列至少包括通过所述词性标注得到的名词;
根据预设的相似度计算方法,计算所述关键词序列与预设的知识图谱索引的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述知识图谱索引包括主语、谓语和宾语三者中的二者,所述主语、谓语和宾语均记载于所述知识图谱中;
若所述相似度值不大于预设的相似度阈值,则通过查询预设的可拆分名词库,从而判断所述关键词序列中是否存在可拆分的指定名词;
若所述关键词序列中存在可拆分的指定名词,则根据预设的名词拆分方法,将所述关键词序列中的指定名词拆为分多个逻辑分词,并将所述指定名词从属的名词记为主名词;
判断所述知识图谱中是否存在指定网络结构,所述指定网络结构指第一实体-第一实体关系-第二实体-第二实体关系-···-第n-1实体关系-第n实体的网络结构,其中,所述第一实体关系、第二实体关系、…、第n-1实体关系与所述多个逻辑分词一一对应,并且所述第一实体与所述主名词相同;
若所述知识图谱中存在指定网络结构,则根据第n实体-第n实体关系-第n+1实体的连接关系,将所述第n实体关系作为答案,或者将所述第n+1实体作为答案;并输出所述答案。


2.根据权利要求1所述的基于知识图谱的智能问答方法,其特征在于,所述对所述问句进行预处理,从而得到关键词序列,其中所述预处理至少包括词性标注,所述关键词序列至少包括通过所述词性标注得到的名词的步骤,包括:
采用预设的词语划分方法,从而将所述问句划分为多个词语,得到由多个词语构成的初始词语序列;
将所述初始词语序列输入经过训练的词性标注模型中的双向编码器架构中进行计算,从而获取双向编码器架构输出的参照序列标注,以及获取双向编码器架构中最后一层转换单元的隐藏状态向量集合,其中,所述词性标注模型包括双向编码器架构和支持向量机架构,双向编码器架构包括多层转换单元,所述参照序列标注至少包括被标注为名词的词语;
将所述隐藏状态向量集合输入所述支持向量机架构中计算,得到所述初始词语序列中的每个词语对应的标注,并组合成暂时标注序列,所述暂时标注序列至少包括被标注为名词的词语;
根据预设的标注相似度值计算方法,计算所述参照序列标注与所述暂时标注序列的标注相似度值,并判断所述标注相似度值是否大于预设的标注相似度阈值;
若所述标注相似度值大于预设的标注相似度阈值,则将所述暂时标注序列作为所述关键词序列,并获取所述关键词序列。


3.根据权利要求2所述的基于知识图谱的智能问答方法,其特征在于,所述双向编码器架构由多层嵌入层、多层转换单元和全连接层顺序连接构成,所述将所述初始词语序列输入经过训练的词性标注模型中的双向编码器架构中进行计算,从而获取双向编码器架构输出的参照序列标注,以及获取双向编码器架构中最后一层转换单元的隐藏状态向量集合的步骤,包括:
利用所述双向编码器架构的多层嵌入层对所述初始词语序列进行嵌入操作,从而获得中间特征序列;
将所述中间特征序列输入所述双向编码器架构的多层转换单元中进行计算,并获取最后一层转换单元的隐藏状态向量集合;
将所述最后一层转换单元的隐藏状态向量集合输入所述全连接层中进行计算,从而得到双向编码器架构输出的参照序列标注。


4.根据权利要求1所述的基于知识图谱的智能问答方法,其特征在于,所述根据预设的相似度计算方法,计算所述关键词序列与预设的知识图谱索引的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述知识图谱索引包括主语、谓语和宾语三者中的二者,所述主语、谓语和宾语均记载于所述知识图谱中的步骤之前,包括:
采用预设的知识图谱搭建工具对预存的指定信息执行实体识别操作,从而得到多个初步实体;
判断所述多个初步实体中是否存在属于同一个同义词组的多个同义实体;
若所述多个初步实体中存在属于同一个同义词组的多个同义实体,则对所述多个初步实体执行同义词替换操作,从而得到多个最终实体,其中所述同义词替换操作指将所述多个同义实体替换为所述同义词组中的一个词语;
获取所述指定信息中所述多个最终实体之间的实体关系,形成最终实体-实体关系-最终实体结构的三元组,并依据所述三元组形成所述知识图谱。


5.根据权利要求1所述...

【专利技术属性】
技术研发人员:许强
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1