【技术实现步骤摘要】
基于wideanddeep网络的FAQ匹配方法、装置、设备和存储介质
本专利技术涉及自然语言处理领域,尤其涉及一种基于wideanddeep网络的FAQ匹配方法、装置、设备和计算机存储介质。
技术介绍
FAQ匹配任务是指给定一组常用问答对,对于给出的问题,寻找是否有与目标问题相匹配的问答对中的问题,若存在这样的候选问题,将其对应的回答作为新问题的回答。目前解决FAQ匹配问题最常见的方法就是构建孪生网络,先得到候选问题和目标问题对应的具有上下文语义的向量表示形式,再计算两个向量的相似度,选择相似度最高的候选问题作为匹配项。但是这个方法没有考虑到句子长度差异、相同词语数量和相同词语顺序等因素,使得预测效果较差。
技术实现思路
针对上述问题,本专利技术的目的在于提供一种基于wideanddeep网络的FAQ匹配方法、装置、设备和存储介质,本专利技术通过提取目标问题和候选问题的上下文信息、句子长度差异、相同词数量以及相同词顺序等特征,得到一个更加全面的相似度进行FAQ匹配。本专利技术实施例提供了一 ...
【技术保护点】
1.一种基于wide and deep网络的FAQ匹配方法,其特征在于,包括:/n分别获取目标问题以及候选问题的文本表征,并分别将所述目标问题以及候选问题的文本表征映射成目标问题的第一映射向量以及候选问题的第二映射向量;/n计算所述第一映射向量以及第二映射向量的第一相似度;/n计算所述目标问题以及候选问题的句子长度差异的第二相似度;/n计算所述目标问题以及候选问题的相同词比例的第三相似度;/n计算所述目标问题以及候选问题的相同词逆序数比例的第四相似度;/n根据所述第一相似度、所述第二相似度、所述第三相似度以及所述第四相似度,以获得文本相似度,并根据所述文本相似度进行FAQ匹配。/n
【技术特征摘要】
1.一种基于wideanddeep网络的FAQ匹配方法,其特征在于,包括:
分别获取目标问题以及候选问题的文本表征,并分别将所述目标问题以及候选问题的文本表征映射成目标问题的第一映射向量以及候选问题的第二映射向量;
计算所述第一映射向量以及第二映射向量的第一相似度;
计算所述目标问题以及候选问题的句子长度差异的第二相似度;
计算所述目标问题以及候选问题的相同词比例的第三相似度;
计算所述目标问题以及候选问题的相同词逆序数比例的第四相似度;
根据所述第一相似度、所述第二相似度、所述第三相似度以及所述第四相似度,以获得文本相似度,并根据所述文本相似度进行FAQ匹配。
2.根据权利要求1所述的基于wideanddeep网络的FAQ匹配方法,其特征在于,分别获取目标问题以及候选问题的文本表,并分别将所述目标问题以及候选问题的文本表征映射成目标问题的第一映射向量以及候选问题的第二映射向量,具体为:
分别获取目标问题以及候选问题的文本表征;
对所述目标问题的文本表征以及候选问题的文本表征切分分词,并基于Word2Vec映射、TextCNN网络后,映射成目标问题的第一映射向量以及候选问题的第二映射向量。
3.根据权利要求2所述的基于wideanddeep网络的FAQ匹配方法,其特征在于,计算所述目标问题以及候选问题的句子长度差异的第二相似度,具体为:
计算每个候选问题与其对应目标问题的词数差的绝对值;
将所述绝对值除以所述候选问题和目标问题的次数之和,作为所述候选问题与所述目标问题的句子长度差异率;
基于所述句子长度差异率,计算所述目标问题以及候选问题的句子长度差异的第二相似度。
4.根据权利要求3所述的基于wideanddeep网络的FAQ匹配方法,其特征在于,计算所述目标问题以及候选问题的相同词比例的第三相似度,具体为:
计算每个候选问题与其对应目标问题相同的词的个数;
将所述个数除以目标问题的总词数,作为所述候选问题的基于相同词比例的第三相似度。
5.根据权利要求4所述的基于wideanddeep网络的FAQ匹配方法,其特征在于,计算所述目标问题以及候选问题的相同词逆序数比例的第四相似度,具体为:
计算每个候选问题与其对应目标问题相同的词的集合;
以目标问题中的相同词出现的顺序作为正序,计算候选问题的相同词的逆序数;
将所述逆序数除以逆序数可能取值的最大值,作为该候选问题的逆序数比例;
基于所述逆...
【专利技术属性】
技术研发人员:胡哲杨,肖龙源,李稀敏,刘晓葳,廖斌,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。