一种基于GAN网络的FAQ生成系统及方法技术方案

技术编号:24091422 阅读:40 留言:0更新日期:2020-05-09 08:14
本发明专利技术公开了一种基于GAN网络的FAQ生成系统及方法,属于深度学习和神经网络技术领域。本发明专利技术的基于GAN网络的FAQ生成系统,由FAQ的问题生成和答案生成两部构成,包括问题特征提取器E、问题域分类器C、问题标签预测器P、答案产生器G和答案判别器D,由特征提取器E、问题域分类器C和问题标签预测器P构成ECP网络,由特征提取器E、问题标签预测器P、答案产生器G和答案判别器D组成网络,最终形成FAQ的问题生成模型,利用FAQ的问题生成模型进行FAQ的答案生成。该发明专利技术的基于GAN网络的FAQ生成系统能够高效准确的为产品服务内容生成FAQ常见问题解答,具有很好的推广应用价值。

A FAQ generation system and method based on GaN network

【技术实现步骤摘要】
一种基于GAN网络的FAQ生成系统及方法
本专利技术涉及深度学习和神经网络
,具体提供一种基于GAN网络的FAQ生成系统及方法。
技术介绍
生成式对抗网络(GAN,GenerativeAdversarialNetworks)是一种深度学习模型,最初由IanGoodfellow提出,是近年来复杂分布上无监督学习最重要的方法之一。GAN模型通过框架中的两个模块生成器(Generator)和判别器(Discriminator)的互相博弈学习产生高质量的输出,其目标是训练一个生成模型完美的拟合真实数据分布使得判别模型无法区分。生成模型的作用是模拟真实数据的分布,判别模型的作用是判断一个样本是真实的样本还是生成的样本,通过轮流训练判别器和生成器,令其相互对抗,从复杂概率分布中采样,最终完成神经网络的训练。目前,GAN网络被广泛应用于图像生成领域,比较常用的有超分辨率,图像翻译,卡通人物生成,人体姿态生成,年龄变换,风格变换等等,GAN可以产生令人印象深刻的结果,并且可以控制平滑且合理的语义变化,生成对应的图像,成为最重要的学习任意复杂数据分布的生成模型框架。FAQ是英文FrequentlyAskedQuestions的缩写,中文意思就是“经常问到的问题”,或者更通俗地叫做“常见问题解答”。FAQ是当前网络上提供在线帮助的主要手段,通过事先组织好一些可能的常问问答对,发布在互联网上为用户提供咨询服务。很多网站上都可以看到FAQ,列出了一些用户在使用产品或服务时常见的问题,是一种在线帮助形式,这样不仅方便了用户,也大大减轻了网站工作人员的压力,节省了大量的顾客服务成本,并且增加了顾客的满意度。针对不同领域、不同产品和服务,有针对性的设计常见问题解答FAQ成为企业关注的问题。在这种情况下,如何有效利用GAN网络技术,兼顾现有模型,基于产品或服务的现有数据,高效准确的为其自动生成有针对性的FAQ成为亟须解决的问题。
技术实现思路
本专利技术的技术任务是针对上述存在的问题,提供一种能够高效准确的为产品服务内容生成FAQ常见问题解答的基于GAN网络的FAQ生成系统。本专利技术进一步的技术任务是提供一种基于GAN网络的FAQ生成方法。为实现上述目的,本专利技术提供了如下技术方案:一种基于GAN网络的FAQ生成系统,该生成系统由FAQ的问题生成和答案生成两部构成,包括问题特征提取器E、问题域分类器C、问题标签预测器P、答案产生器G和答案判别器D,由特征提取器E、问题域分类器C和问题标签预测器P构成ECP网络,由特征提取器E、问题标签预测器P、答案产生器G和答案判别器D组成网络,最终形成FAQ的问题生成模型,利用FAQ的问题生成模型进行FAQ的答案生成。作为优选,所述问题特征提取器E为神经网络,实现在文字中提取特征,生成常见问题特征向量,在提高问题标签预测器P的预测正确率时,使问题域分类器C无法区分问题来自的领域。作为优选,所述问题域分类器C根据所述的问题特征提取器E产生的结果,做出正确的领域分类,区分出提取的问题特征向量来自的具体领域。作为优选,所述问题标签预测器P的目标是根据所述的问题特征提取器E产生的结果,准确的预测分类问题标签,确定产生的FAQ问题内容。作为优选,所述答案产生器G是一个神经网络,根据FAQ的问题来生成一段问题答案。作为优选,所述答案判别器D是一个神经网络,相当于是二元分类器,判断生成的问题答案是否真实。一种基于GAN网络的FAQ生成方法,该方法基于所述的基于GAN网络的FAQ生成系统实现,包括生成FAQ网络模型的训练和生成FAQ问题和答案的训练。作为优选,所述生成FAQ网络模型的训练包括以下步骤:如图2所示,所述生成FAQ网络模型的训练包括以下步骤:S101、收集目标领域产品服务数据训练集,进行数据的预处理和数据标记;S102、基于已训练好的所述的问题特征提取器E,联合所述的问题域分类器C和所述的问题标签预测器P,利用现有标记数据集,包括当前所述的问题特征提取器E模型的样例以及目标领域的样本进行训练;S103、所述的问题特征提取器E计算提取文字特征,得到结果后,喂给所述的问题域分类器C和所述的问题标签预测器P,根据其目标函数进行模型参数优化,最终得到模型;S104、将所述的问题特征提取器E和所述的问题标签预测器P联合起来,记作网络EP,与所述的答案生成器G和所述的答案判别器D,交替训练;S105、所述的答案产生器G根据真实问题,产生答案,得到真实问题产生的答案;S106、将所述的答案生成器G产生的答案,经过联合所述的问题特征提取器E和所述的问题标签预测器P形成的网络EP,预测结果产生问题,得到预测的问题产生的答案;S107、使用所述的答案产生器G产生的真实问题的答案、网络EP预测得到的预测的问题产生的答案及目标领域真实的FAQ问题答案配对真实问题的真实答案作为训练样本,训练所述的答案判别器D;S108、将所述的答案产生器G和所述的答案判别器D联合起来,形成一个神经网络,固定所述的答案判别器D的模型参数,训练所述的答案生成器G,使得所述的答案判别器D无法区分G生成的问题答案对和目标领域真实的FAQ问题答案配对;同时,将所述的答案生成器G和所述的EP网络联合起来,形成一个神经网络,固定所述的EP网络的模型参数,训练所述的答案生成器G,使得所述的EP网络产生的输出与所述的答案生成器G的输入越接近;S109、反复进行训练,得到最终的网络模型E+P+G。作为优选,所述生成FAQ问题和答案的训练包括以下步骤:S201、将产品服务相关文档及训练得到的网络模型发布到互联网上,提供对外服务;S202、将利用模型生成的FAQ常见问题解答以网页形式发布到互联网中,对外提供服务;S203、用户查看网站提供的FAQ常见问题解答来解决其遇到问题;如果解决,则标明相关问题;如果无法解决,则跳转到步骤204;S204、用户通过输入要解决的问题或者用户使用中产生的疑问,经过E+P网络,提炼出问题,并且通过G网络产生答案;S205、用户针对生成问题和答案进行评分判断,并进行反馈;S206、通过收集用户的搜索行为及反馈,持续反馈并优化模型,同时更新FAQ常见问题解答列表。与现有技术相比,本专利技术的基于GAN网络的FAQ生成方法具有以下突出的有益效果:所述基于GAN网络的FAQ生成方法基于具体的产品服务的生成模型发布到互联网上,提供检索服务,通过根据用户使用FAQ的频度及反馈,可以持续优化模型参数,为产品服务文档生成更加高质量的FAQ内容,进而减轻了产品服务工作人员的压力,节省了大量的顾客服务成本,并且增加了顾客的满意度,具有良好的推广应用价值。附图说明图1是本专利技术所述基于GAN网络的FAQ生成系统的拓扑图;图2是本专利技术所述基于GAN网络的FAQ生成方法的生成FAQ网络模型的训练流程图;图3是本专利技术所述基于GAN网络本文档来自技高网
...

【技术保护点】
1.一种基于GAN网络的FAQ生成系统,其特征在于:该生成系统由FAQ的问题生成和答案生成两部构成,包括问题特征提取器E、问题域分类器C、问题标签预测器P、答案产生器G和答案判别器D,由特征提取器E、问题域分类器C和问题标签预测器P构成ECP网络,由特征提取器E、问题标签预测器P、答案产生器G和答案判别器D组成网络,最终形成FAQ的问题生成模型,利用FAQ的问题生成模型进行FAQ的答案生成。/n

【技术特征摘要】
1.一种基于GAN网络的FAQ生成系统,其特征在于:该生成系统由FAQ的问题生成和答案生成两部构成,包括问题特征提取器E、问题域分类器C、问题标签预测器P、答案产生器G和答案判别器D,由特征提取器E、问题域分类器C和问题标签预测器P构成ECP网络,由特征提取器E、问题标签预测器P、答案产生器G和答案判别器D组成网络,最终形成FAQ的问题生成模型,利用FAQ的问题生成模型进行FAQ的答案生成。


2.根据权利要求1所述的基于GAN网络的FAQ生成系统,其特征在于:所述问题特征提取器E为神经网络,实现在文字中提取特征,生成常见问题特征向量,在提高问题标签预测器P的预测正确率时,使问题域分类器C无法区分问题来自的领域。


3.根据权利要求2所述的基于GAN网络的FAQ生成系统,其特征在于:所述问题域分类器C根据所述的问题特征提取器E产生的结果,做出正确的领域分类,区分出提取的问题特征向量来自的具体领域。


4.根据权利要求3所述的基于GAN网络的FAQ生成系统,其特征在于:所述问题标签预测器P的目标是根据所述的问题特征提取器E产生的结果,准确的预测分类问题标签,确定产生的FAQ问题内容。


5.根据权利要求4所述的基于GAN网络的FAQ生成系统,其特征在于:所述答案产生器G是一个神经网络,根据FAQ的问题来生成一段问题答案。


6.根据权利要求5所述的基于GAN网络的FAQ生成系统,其特征在于:所述答案判别器D是一个神经网络,相当于是二元分类器,判断生成的问题答案是否真实。


7.一种基于GAN网络的FAQ生成方法,其特征在于:该方法基于权利要求1-6任意一项所述的基于GAN网络的FAQ生成系统实现,包括生成FAQ网络模型的训练和生成FAQ问题和答案的训练。


8.根据权利要求7所述的基于GAN网络的FAQ生成方法,其特征在于:所述生成FAQ网络模型的训练包括以下步骤:
S101、收集目标领域产品服务数据训练集,进行数据的预处理和数据标记;
S102、基于已训练好的所述的问题特征提取器E,联合所述的问题域分类器
C和所述的问题标签预测器P,利用现有标记数据集,包括当前所述的问题特征提取器E模型的样例...

【专利技术属性】
技术研发人员:孙善宝于玲王子彤谭强
申请(专利权)人:山东浪潮人工智能研究院有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1