一种基于电网实训问答知识库的交互式智能问答方法技术

技术编号:33286642 阅读:19 留言:0更新日期:2022-04-30 23:55
本发明专利技术涉及一种基于电网实训知识库的交互式智能问答方法,包括以下步骤:构建包含电网实训的问题描述和答案的电网实训知识库;基于电网实训知识库中的问题描述和答案的预训练基于神经网络的语义模型库;由用户提出问题,获取提问者提出的原始文本并进行预处理,将原始文本转换为标准文本;获取用户提出的历史问题,结合历史问题对所述标准文本进行语境识别,获取对应的语境识别结果;基于所述语境识别结果对标准文本进行实体提取,获取实体提取结果;将语境识别结果及实体提取结果输入至语义识别模型,输出相应的答案;将答案转换为自然语言描述文本回复给用户。自然语言描述文本回复给用户。自然语言描述文本回复给用户。

【技术实现步骤摘要】
一种基于电网实训问答知识库的交互式智能问答方法


[0001]本专利技术涉及一种基于电网实训问答知识库的交互式智能问答方法,属于自然语言处理


技术介绍

[0002]随着图像识别、语音识别、自然语言处理等人工智能技术蓬勃发展以及在电力运检、安监、营销等应用领域的持续落地,电网企业对于构建人工智能实训环境,培养人工智能专业队伍,推进人工智能技术更为广泛应用的需求也在不断增长。希望通过电网人工智能实训环境,为用户提供基于自然语言的智能交互解答模式,为实训过程中提供精准信息解答,降低人工智能实训操作门槛,提升人工智能实训系统的易用性水平,达到有效降低人工培训的成本。
[0003]然而,电网人工智能技术作为一门需要大量知识准备的专业技术,开展难度较大,普通学员在操作过程中需要大量的指导、建议和专业知识解答,而传统的搜索和匹配式解答反馈,不能和用户操作过程有效结合、无法识别用户当前所处的环境,只能实现较低级别的信息检索与反馈,用户体验不佳,难以满足人工智能实训的目标。
[0004]有必要在电网实训问答知识库的基础上,能够结合电网实训的全过程和具体环节,提供全面的课程信息、专业知识、技术文档、操作方法等问题的交互式解答,从而降低人工智能实训操作门槛,提升用户体验,不断提升人工智能实训平台的实用化水平。
[0005]现有的智能问答技术如公开号为“CN109977204A”的专利技术专利公开了一种基于知识库的智能问答系统和方法,该系统包括:问题获取模块,用于获取问题文字;语义分词模块,用于对问题文字进行语义分词,得到问题文字中的特征词;问题检索模块,用于根据特征词在预设的问答知识库中检索与特征词相似度最高的问题作为目标问题;答案反馈模块,用于向用户反馈目标问题对应的目标答案,如此,将问答知识以问题和答案对应关联并存储于问答知识库中,并通过人工智能的技术替代或辅助客服解决用户提出的问题,减少企业在咨询场景客服人力的投入,释放客服的工作量,为企业节省成本和提高用户服务满意度。上述现有技术存在的问题是未考虑用户提问的会话场景和多问题的关联性,只是对每个问题进行独立解答,难以避免因无法获得丰富的用户意图信息,而反馈错误的问题答案。
[0006]又如公开号为“CN112115238A”的专利技术专利公开了一种基于BERT和知识库的问答方法和系统,该方法针对现有的知识库问答系统存在的缺陷,分别构建基于BERT

CRF和语言模型的命名实体识别模型,与基于BERT和语言模型的文本相似度二分类模型;并对两个模型进行训练,采用训练完成的两个模型对待解答的问题语料进行处理,能得到该问题的正确答案,并自动改写回答。该现有技术虽然利用多头注意力机制,利用了问题字串的字与字或词与词之间的关系,并通过BERT词嵌入得到了更多层次的语义表示,但同样只是对每个问题字串进行分析和提取特征,未考虑用户提问的会话场景和多问题的关联性。在一定会话场景下,也难以避免因无法获得连贯的用户意图信息,而反馈错误的问题答案。

技术实现思路

[0007]为了解决上述现有技术中存在的问题,本专利技术提出了一种基于电网实训知识库的交互式智能问答方法,在电网实训知识库的基础上,构建了基于神经网络的语义模型库,并提取用户提问的语境,实现联合问题语义、提问者的背景知识和用户连贯意图进行电网实训知识库的检索,将检索到的相关答案转化为自然语言描述文本,从而实现从用户问题理解、问题检索、答案生成的一问一答和交互式应答的方法。
[0008]本专利技术的技术方案如下:
[0009]一方面,本专利技术提供一种基于电网实训知识库的交互式智能问答方法,包括以下步骤:
[0010]构建包含电网实训的问题描述和答案的电网实训知识库;
[0011]基于电网实训知识库中的问题描述和答案的预训练基于神经网络的语义模型库;
[0012]由用户提出问题,获取提问者提出的原始文本并进行预处理,将原始文本转换为标准文本;
[0013]获取用户提出的历史问题,结合历史问题对所述标准文本进行语境识别,获取对应的语境识别结果;
[0014]基于所述语境识别结果对标准文本进行实体提取,获取实体提取结果;
[0015]将语境识别结果及实体提取结果输入至语义识别模型,输出相应的答案;将答案转换为自然语言描述文本回复给用户。
[0016]作为优选实施方式,所述获取提问者提出的原始文本并进行预处理,将原始文本转换为标准文本的步骤具体为:
[0017]对原始文本进行纠错;
[0018]对纠错后的原始文本进行分词处理和词性标注;
[0019]基于分词处理和词性标注的结果,结合同义词库、近义词库及停用词库,去除原始文本中的停用词,并将近义词、同义词进行归一化;
[0020]对经过上述处理后的原始文本进行句法分析,基于句法分析结果简化原始文本的语句描述,生成标准文本。
[0021]作为优选实施方式,所述语义模型库包括嵌入层、编码层、交互层以及输出层;
[0022]所述嵌入层用于将输入的问题描述和答案的文本转换为短语向量;
[0023]所述编码层对短语向量进行编码,提取短语向量的特征;
[0024]所述交互层对问题描述和答案进的文本行逐字交互,获取问题描述中的短语向量相对答案中的短语向量的加权状态,并对问题描述和答案中的短语向量的特征进行融合;
[0025]所述输出层根据交互层输出的融合特征产生答案。
[0026]作为优选实施方式,在所述嵌入层中,利用短语嵌入模型将输入的问题描述和答案的文本映射到N维连续的空间中,生成短语向量。
[0027]作为优选实施方式,所述编码层采用CNN卷积神经网络对短语向量进行编码。
[0028]作为优选实施方式,所述交互层中引入自注意力机制,将融合特征自己与自己进行注意力学习,捕获短语向量之间的依赖关系。
[0029]作为优选实施方式,所述输出层采用双向LSTM神经网络,在每个提问时刻,捕捉与当前问题和答案相关的语义关联信息,基于语义关联信息检索相关答案,并将检索到的答
案转换为自然语言描述文本。
[0030]作为优选实施方式,采用BERT迁移学习模型进行语境识别,通过用户提出的历史问题,学习用户的关注特征,基于关注特征获取用户的关注场景和关注领域。
[0031]作为优选实施方式,采用BERT

BiLSTM

CRF模型进行实体提取,基于用户的关注场景和关注领域,提取标准文本中的实体词。
[0032]另一方面,本专利技术提供一种基于电网实训知识库的交互式智能问答装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术任一实施例所述的交互式智能问答方法。
[0033]本专利技术具有如下有益效果:
[0034]1、本专利技术一种基于电网实训知识库的交互式智能问答方法,构建了基于神经网络的语义模型库,并提取用户提问的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于电网实训知识库的交互式智能问答方法,其特征在于,包括以下步骤:构建包含电网实训的问题描述和答案的电网实训知识库;基于电网实训知识库中的问题描述和答案的预训练基于神经网络的语义模型库;由用户提出问题,获取提问者提出的原始文本并进行预处理,将原始文本转换为标准文本;获取用户提出的历史问题,结合历史问题对所述标准文本进行语境识别,获取对应的语境识别结果;基于所述语境识别结果对标准文本进行实体提取,获取实体提取结果;将语境识别结果及实体提取结果输入至语义识别模型,输出相应的答案;将答案转换为自然语言描述文本回复给用户。2.根据权利要求1所述的一种基于电网实训知识库的交互式智能问答方法,其特征在于,所述获取提问者提出的原始文本并进行预处理,将原始文本转换为标准文本的步骤具体为:对原始文本进行纠错;对纠错后的原始文本进行分词处理和词性标注;基于分词处理和词性标注的结果,结合同义词库、近义词库及停用词库,去除原始文本中的停用词,并将近义词、同义词进行归一化;对经过上述处理后的原始文本进行句法分析,基于句法分析结果简化原始文本的语句描述,生成标准文本。3.根据权利要求1所述的一种基于电网实训知识库的交互式智能问答方法,其特征在于:所述语义模型库包括嵌入层、编码层、交互层以及输出层;所述嵌入层用于将输入的问题描述和答案的文本转换为短语向量;所述编码层对短语向量进行编码,提取短语向量的特征;所述交互层对问题描述和答案进的文本行逐字交互,获取问题描述中的短语向量相对答案中的短语向量的加权状态,并对问题描述和答案中的短语向量的特征进行融合;所述输出层根据交互层输出的融合特征产生答案。4....

【专利技术属性】
技术研发人员:陈江海苏江文王秋琳卢伟龙张晓东郑略省
申请(专利权)人:国网信息通信产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1