一种基于航空装备的智能问答方法及系统技术方案

技术编号:34111492 阅读:52 留言:0更新日期:2022-07-12 01:27
本发明专利技术公开了一种基于航空装备的智能问答方法及系统,所述包括提取实体与意图候选集,并根据优先等级对实体、意图候选集排序;基于用户意图进行第一实体纠错与校对;基于结构化问答知识库与句法分析树进行意图提取、校对与推理;将实体、意图、问答类型进行槽位填充;判定实体类型,并基于中心实体信息进行多步查询与推理;基于用户意图、实体信息进行全文在线抽取答案;记录问题、答案、实体、意图相关信息;提供答案给用户。所述系统包括实体与意图获取模块,实体纠错与校对模块,意图提取、校对与推理模块,槽位填充模块、匹配与推理模块、检索与信息抽取模块、信息记录模块与提供模块。信息记录模块与提供模块。信息记录模块与提供模块。

【技术实现步骤摘要】
一种基于航空装备的智能问答方法及系统


[0001]本专利技术涉及自然语言处理和搜索
,尤其涉及一种基于航空装备的智能问答方法及系统。

技术介绍

[0002]问答系统是信息检索系统的一种高级形式,能够准确、简洁地用自然语言回答用户提出的问题。传统的问答系统常常采用基于模板与神经网络的方式实现,且对问答领域有强烈的划分。基于模板的问答系统能够准确地匹配用户简单的问题,同时需要大量人工构建问题模板,模板不具有迁移性。基于神经网络的问答系统能够准确地识别用户意图,通过实体槽位填充,准确地获取用户信息,但需要大量的语料进行模型训练,且当问题较为复杂时,模型回复质量将会变差。因此本申请提出一种基于航空装备的智能问答方法与装置。该方法能够摆脱模型训练对数据的依赖,有效地提取出用户意图、实体信息,并基于中心实体信息进行多步查询与推理;同时针对无答案的问题能够进行全文在线提取,提升了问答准确性与效率。

技术实现思路

[0003]为解决上述技术问题,本专利技术的目的是提供一种基于航空装备的智能问答方法及系统,所述方法与系统能够摆脱模型训练对数据的强依赖性,有效地提取出用户意图、实体信息,并基于中心实体信息进行多步查询与推理;同时针对无答案的问题能够进行全文在线提取,提升了问答准确性与效率。
[0004]本专利技术的目的通过以下的技术方案来实现:
[0005]一种基于航空装备的智能问答方法,包括:
[0006]步骤10提取实体与意图候选集,并根据优先等级对实体、意图候选集排序;
[0007]步骤20基于用户意图进行第一实体纠错与校对;
[0008]步骤30基于结构化问答知识库与句法分析树进行意图提取、校对与推理;
[0009]步骤40将实体、意图、问答类型进行槽位填充;
[0010]步骤50判定实体类型,并基于中心实体信息进行多步查询与推理;
[0011]步骤60基于用户意图、实体信息进行全文在线抽取答案;
[0012]步骤70记录问题、答案、实体、意图相关信息;
[0013]步骤80提供答案给用户。
[0014]一种基于航空装备的智能问答系统,包括:实体与意图获取模块,实体纠错与校对模块,意图提取、校对与推理模块,槽位填充模块、匹配与推理模块、检索与信息抽取模块、信息记录模块与提供模块;所述
[0015]实体与意图获取模块,用户获取用户输入序列实体与意图候选集;
[0016]实体纠错与校对模块,用户输入序列实体的纠错以及实体的校对;
[0017]意图提取、校对与推理模块,用于获取输入序列的真正意图;
+“提出”=“提出者”。
[0036]步骤20基于用户意图进行第一实体纠错与校对;
[0037]具体地,基于用户意图确定概率最大的第一候选实体。例如“直升机用高极压润滑油规范修改单是否可行?”中候选集实体为“直升机用高极压润滑油规范修改单”,“高极压润滑油规范修改单”,意图为“直升机用高极压润滑油规范修改单”有效性,而非直升机用“高极压润滑油规范修改单”是否可行。
[0038]第一实体纠错、校对分别采用ES搜索技术、Faiss语义搜索技术进行实现。ES搜索技术、Faiss分别从字符串级别、语义级别获取实体候选集。ES候选集中与第一实体相似度大于0.95,将第一候选实体替换为第一实体信息。ES中无相似实体,采用Faiss搜索引擎进行基于词嵌入的实体语义相似度计算,其中Faiss搜索引擎中实体文本训练采用IndexIVFFlat方法,词向量计算采用sentence transformer神经网络。当相似度值大于0.85则进行实体纠错与替换。第一实体纠错、校对采用ES搜索引擎、Faiss搜索引擎分别从字符、语义层面进行实体校对,并非局限于某一具体方式,如词嵌入的训练可采用“sentence transformer神经网络”、“Bert”、“Genism”等;“IndexIVFFlat”训练搜索引擎可采用“IndexIVFFlat”、“IndexFlatL2”等。
[0039]步骤30基于结构化问答知识库与句法分析树进行意图提取、校对与推理;
[0040]具体地,如图2所示,结构化问答知识库位先前用户问题、答案、实体、意图相关信息。将掩盖实体信息的问题与结构化问答知识库中掩盖实体信息的问题进行相似度计算,提取用户意图;同时句法分析对输入问题序列的词、词性进行句法分析,提取用户意图。如图3所示,输入序列通过分词技术获取序列的词与词性,并根据词性进行语法树的搭建。其中“是”为谓语,为根节点,“额定速度”为主语,“什么”为代词,缺少宾语,因此意图为“额定速度”。通过句法树可以获取用户的意图。基于结构化问答知识库意图等级大于基于句法分析树获取的意图等级,并获取新意图。将新意图与原有意图与Faiss搜索引擎进行意图校对。当校对后的意图为非同一意图,则校对后的新意图替换原有意图,并重新对实体信息进行校对。当校对后的意图为同一意图,则校对后的新意图替换原有意图,并进行问答类型的判定与推理。
[0041]问答类型的判定分为一般疑问句和判断句。其中一般疑问句为问题中缺失成分,由问答系统进行回复。例如问句“直升机用高极压润滑油规范修改单的提出者是谁?”缺少宾语,则由问答系统进行回复。判断句为问题中成分齐全,由问答系统对答案进行校对。例如“直升机用高极压润滑油规范修改单的提出者是张伟吗?”,问答系统根据获取的答案进行对比回复。
[0042]步骤40将实体、意图、问答类型进行槽位填充;
[0043]步骤50判定实体类型,并基于中心实体信息进行多步查询与推理;
[0044]具体地,通过ES搜索引擎获取实体索引Id、实体中心节点信息,并根据索引Id获取图数据库中该实体节点对应的所有关系。当实体信息为非中心节点实体且该实体对应的关系不包含相关意图时,实体向中心实体转移并进行再次查询,如图4所示。当实体节点对应多个中心节点时,根据中心节点相关性描述进行多跳查询。同时当问答类型为判断句时,进行实体信息判定。
[0045]步骤60基于用户意图、实体信息进行全文在线抽取答案;
[0046]具体地,当数据库中无相关答案时,问答系统基于ES搜索引擎对所有航空领域相关标准进行在线推理与提取。如问题“火炸药的寿命终止条件是什么?”对应的实体为“火炸药”,用户意图为“寿命终止条件”。问答系统基于实体“火炸药”与用户意图“寿命终止条件”进行ES相似度搜索,获取实体信息集合:“火炸药贮存安全规程”、“火炸药标准物质通用规范”、“火炸药定型规程”,并通过字符串匹配算法进行意图定位与答案的抽取。
[0047]步骤70将问题、答案、实体、意图相关信息进行记录;
[0048]具体地,问答系统将问题、答案、实体、意图信息记录在数据库中,同时对数据库中的数据进行异步处理,如图2结构化知识库模块。同时将问题中的实体信息进行掩码存储,并去除重复项,为意图提取提供数据支撑。
[0049]步骤80答案提供给用户。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于航空装备的智能问答方法,其特征在于,所述方法包括以下步骤:步骤10提取实体与意图候选集,并根据优先等级对实体、意图候选集排序;步骤20基于用户意图进行第一实体纠错与校对;步骤30基于结构化问答知识库与句法分析树进行意图提取、校对与推理;步骤40将实体、意图、问答类型进行槽位填充;步骤50判定实体类型,并基于中心实体信息进行多步查询与推理;步骤60基于用户意图、实体信息进行全文在线抽取答案;步骤70记录问题、答案、实体、意图相关信息;步骤80提供答案给用户。2.如权利要求1所述的基于航空装备的智能问答方法,其特征在于,所述步骤10中基于固定句型、专业词典分词技术、AC自动机技术、神经网络实体识别技术、神经网络意图提取技术、正则方法提取实体与意图候选集。3.如权利要求1或2所述的基于航空装备的智能问答方法,其特征在于,实体提取等级划分为:AC自动机技术>=正则>=固定句型>=专业词典分词技术>=神经网络实体识别技术;意图提取划分等级为:固定句型>=专业词典分词技术>=神经网络意图提取技术。4.如权利要求1所述的基于航空装备的智能问答方法,其特征在于,所述步骤20中第一实体纠错、校对分别采用ES搜索技术、Faiss语义搜索技术进行实现,其中ES搜索技术、Faiss分别从字符串级别、语义级别获取实体候选集。5.如权利要求1所述的基于航空装备的智能问答方法,其特征在于,所述步骤30中,结构化问答知识库为先前用户问题、答案、实体、意图相关信息,并将掩盖实体信息的问题与结构化问答知识库中掩盖实体信息的问题进行相似度计算,提取用户意图,同时句法分析对输入问题序列的词、刺激性进行句法分析,提取用户意图。6.如权利要求1所述的基于航空装备的智能问答方法,其特征在于,所述步骤50具体包括:通过ES搜索引擎获取实体索引Id、实体中心节点信息,并根据索引Id获取图数据库中该实体节点对应的所有关系;当实体信息为非中心节点实体且该实体对应的关系不包含相关意图时,实体向中心实体转移并进行再次查询,当实体节点对...

【专利技术属性】
技术研发人员:贾亚飞吕强段飞虎印东敏杨永秀蔡陨顾君张宏伟
申请(专利权)人:同方知网北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1