【技术实现步骤摘要】
基于双向注意力机制的智能问答方法、装置、设备及介质
[0001]本专利技术涉及人工智能
,尤其涉及一种基于双向注意力机制的智能问答方法、装置、设备及介质。
技术介绍
[0002]现有技术的智能问答场景中,一般基于语料库进行,所使用的语料库中的语料往往有限,如果无法及时更新语料库,会导致准确率大幅下降,影响客户体验,并且基于语料库的智能问答缺乏泛化能力,不利于提高智能问答准确性。
技术实现思路
[0003]本专利技术的目的在于提供一种基于双向注意力机制的智能问答方法、装置、设备及介质,以解决现有技术中智能问答准确性低的技术问题。
[0004]本专利技术的技术方案如下:提供一种基于双向注意力机制的智能问答方法,包括:
[0005]对文本和问题中的句子分别进行分词处理,得到所述文本对应的文本分词序列以及所述问题对应的问题分词序列;
[0006]对所述文本分词序列和所述问题分词序列分别进行词向量化处理,得到所述文本分词序列对应的文本初始特征向量以及所述问题分词序列对应的问题初
【技术保护点】
【技术特征摘要】
1.一种基于双向注意力机制的智能问答方法,其特征在于,包括:对文本和问题中的句子分别进行分词处理,得到所述文本对应的文本分词序列以及所述问题对应的问题分词序列;对所述文本分词序列和所述问题分词序列分别进行词向量化处理,得到所述文本分词序列对应的文本初始特征向量以及所述问题分词序列对应的问题初始特征向量;利用第一双向LSTM编码层对所述文本初始特征向量和所述问题初始特征向量进行语义编码,分别得到文本语义特征向量和问题语义特征向量;将所述文本语义特征向量的转置向量与所述问题语义特征向量相乘得到第一交互矩阵,将所述第一交互矩阵的每个元素进行softmax函数计算得到对应的第二交互矩阵;将所述第一交互矩阵和所述第二交互矩阵进行拼接,获得综合交互矩阵;将所述综合交互矩阵输入至双向LSTM模型中,对答案在所述文本中的初始位置和终止位置进行预测,其中,所述双向LSTM模型输出第一概率特征向量和第二概率特征向量,所述第一概率特征向量包括所述文本中每个所述分词是答案的起始位置的概率,所述第二概率特征向量包括所述文本中每个所述分词是答案的终止位置的概率,将所述第一概率特征向量中概率最大的分词作为所述答案的起始位置,将所述第二概率特征向量中概率最大的分词作为所述答案的终止位置。2.根据权利要求1所述的基于双向注意力机制的智能问答方法,其特征在于,所述对所述文本分词序列和所述问题分词序列分别进行词向量化处理,得到所述文本分词序列对应的文本初始特征向量以及所述问题分词序列对应的问题初始特征向量之后,还包括:基于预设的外部知识库对所述文本分词序列和所述问题分词序列分别进行词向量化处理,获取所述文本基于词的文本知识特征向量以及所述问题基于词的问题知识特征向量;将所述文本的所述文本语义特征向量和所述文本知识特征向量进行特征融合,得到所述文本融合特征向量;将所述问题的所述问题语义特征向量和所述问题知识特征向量进行特征融合,得到所述问题融合特征向量;相应地,所述将所述文本语义特征向量的转置向量与所述问题语义特征向量相乘得到第一交互矩阵,将所述第一交互矩阵的每个元素进行softmax函数计算得到对应的第二交互矩阵,包括:将所述文本融合特征向量的转置向量与所述问题融合特征向量相乘得到第一交互矩阵,将所述第一交互矩阵的每个元素进行softmax函数计算得到对应的第二交互矩阵。3.根据权利要求2所述的基于双向注意力机制的智能问答方法,其特征在于,所述基于预设的外部知识库对所述文本分词序列和所述问题分词序列分别进行词向量化处理,获取所述文本基于词的文本知识特征向量以及所述问题基于词的问题知识特征向量,包括:从预设的外部知识库中获取所述文本分词序列和所述问题分词序列中每个分词的义原向量,得到所述文本分词序列的文本语义表示序列和所述问题分词序列的问题语义表示序列;利用word2vec模型获取对所述文本语义表示序列及所述问题语义表示序列中每个义原向量进行编码,基于编码后的义原向量得到文本知识特征向量以及问题知识特征向量。
4.根据权利要求2所述的基于双向注意力机制的智能问答方法,其特征在于,所述利用第一双向LSTM编码层对所述文本初始特征向量和所述问题初始特征向量进行语义编码,分别得到文本语义特征向量和问题语义特征向量之后,还包括:根据所述问题知识特征向量和所述文本知识特征向量计算所述问题中每个分词与所述文本中每个分词的相似度,得到相似度矩阵;根据所述相似度矩阵计算文本对问题的第一注意力权重矩阵以及问题对...
【专利技术属性】
技术研发人员:庞有振,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。