一种基于双向异步序列的对话生成方法及系统技术方案

技术编号：33437194 阅读：53 留言：0更新日期：2022-05-19 00:25

本发明专利技术公开了一种基于双向异步序列的对话生成方法，包括：S1获取对话文本，识别对话文本中的关键词，并生成所述关键词对应的词向量；S2基于S1中获得的词向量，生成对话文本的语句向量；S3将S2中获得的对话文本的语句向量，与知识问答库中样本问句的语句向量计算相似度，生成包括多个候选答案的答案集以及候选答案对应的词向量；S4基于S3中生成的答案集以及对应的词向量，通过双向异步序列算法，获得初始回答文本；S5对初始回答文本进行修正，输出最终的回答文本。本发明专利技术还提供了一种实施上述方法的系统。通过本发明专利技术的方法生成的回答文本附带有更多拓展内容，通过修正算法避免了重复用词的问题，进一步提高了回答文本的质量。进一步提高了回答文本的质量。进一步提高了回答文本的质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双向异步序列的对话生成方法及系统

[0001]本专利技术涉及人工智能、神经网络与自然语言处理领域，尤其涉及一种基于双向异步序列的对话生成方法及系统。

技术介绍

[0002]人机对话一直是自然语言处理的一个热门研究领域，多样性和不确定性是人机对话更“真实”的关键因素，且得益于神经网络的发展，数据驱动生成式对话模型在灵活性和交互自由度方面显示出巨大潜力。
[0003]在神经网络广泛应用之前，对话生成任务的主要方法依赖于统计方法和检索方法，不仅受限于特定领域，而且在大部分任务中需要人为设置规则进行导向。在神经网络出现后，尤其是卷积神经网络在图像处理领域广泛应用和循环神经网络在文本处理领域取得优秀成果后，将神经网络用于对话生成也成为热点研究项目。相对于传统的统计方法、检索方法和指定规则方法，利用神经网络进行对话生成所受的限制更低，可以在任意数据集上进行学习，并且可以取得充分拟合后的优良效果。即使用特定领域数据集，或者数据集包含大量噪声，神经网络模型依旧能够充数据集中抽取知识。并且随着多种深度学习框架的开发和开源，使得...

【技术保护点】

【技术特征摘要】
1.一种基于双向异步序列的对话生成方法，其特征在于，包括：S1获取对话文本，识别对话文本中的关键词，并生成所述关键词对应的词向量；S2基于S1中获得的词向量，生成对话文本的语句向量；S3将S2中获得的对话文本的语句向量，与知识问答库中样本问句的语句向量计算相似度，生成包括多个候选答案的答案集以及候选答案对应的词向量；S4基于S3获得的答案集中候选答案以及对应的词向量，通过双向异步序列算法，获得初始回答文本；S5对初始回答文本进行修正，输出最终的回答文本。2.根据权利要求1所述的对话生成方法，其特征在于，所述S2中具体为：S2.1将关键词的词向量转换为词向量矩阵；S2.2通过Bi
‑
LSTM网络生成每个关键词对应的隐藏向量；S2.3将所有关键词的隐藏向量链接起来，获得对应对话文本的语句向量。3.根据权利要求1所述的对话生成方法，其特征在于，所述S3中知识问答库是输入样本问句与对应的候选答案三元组，通过双层Bi
‑
LSTM网络进行训练获得。4.根据权利要求1所述的对话生成方法，其特征在于，所述S4双向异步序列算法是基于反向解码器与正向解码器对答案集中候选答案以及对应的词向量进行解码。5.根据权利要求4所述的对话生成方法，其特征在于，所述反向解码器与正向解码器对答案集中候选答案以及对应的词向量进行解码，具体为：S4.1从所述答案集中选取相似度最高的候选答案作为起始词；S4.2基于起始词与对应的词向量，通过反向解码器倒序生成前半部回答文本；S4.3对...

【专利技术属性】
技术研发人员：赵亚萍，曹钰，陈超，王勇超，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人