一种相似语句生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39188721 阅读:10 留言:0更新日期:2023-10-27 08:36
本申请涉及一种相似语句生成方法、装置、计算机设备和存储介质。所述方法包括:对原始语句进行分词处理,获取原始词汇,对原始词汇进行同义词替换,获取第一扩展语句;通过预设的卷积神经网络提取原始语句的局部特征,通过预设的长短期记忆网络局部特征及其对应的上下文进行学习,获取综合特征,并对综合特征进行分类处理,获取概率特征,根据概率特征获取第二扩展语句;将第一扩展语句与第二扩展语句进行融合,获取第三扩展语句,根据第三扩展语句与原始语句的相似度数值,获取原始语句对应的相似语句,可解决生成的相似语句比较单一、相似语句的中心意思与原始语句相比发生较大变化等问题。变化等问题。变化等问题。

【技术实现步骤摘要】
一种相似语句生成方法、装置、计算机设备和存储介质


[0001]本专利技术涉及人工智能
,特别是涉及一种相似语句生成方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着互联网技术的高速发展,网络信息已呈现出碎片化、移动化、实时化、个性化、多媒体化、以及大数据化的特点,人们也要求信息服务能够更及时、快速和准确。在客服服务场景中,可以预先配置一些常用并且描述清晰的问题及其对应的回答,然后利用智能客服技术对客户咨询的问题进行判断识别并进行相应的回应。
[0003]然而,人工配置相似语句是一个相当耗费时间和精力的过程,并且生成高质量、具有总结概括性质的问题会给运营人员带来极大的负担。因此,可以自动生成一些相似语句供运营人员选择,减轻运营人员的负担。目前,可以通过基于规则的方法识别出原始语句的关键词,再将关键词进行同义词替换,生成相似语句,还可以通过基于文本生成模型的方法对原始语句进行扩展,生成相似语句,然而上述方法可能导致相似语句比较单一、相似语句的中心意思与原始语句相比发生较大变化等问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种相似语句生成方法、装置、计算机设备和存储介质,改善相似语句生成质量不佳的问题。
[0005]一方面,提供一种相似语句生成方法,所述相似语句生成方法包括:
[0006]对所述原始语句进行分词处理,获取原始词汇,对所述原始词汇进行同义词替换,获取第一扩展语句;
[0007]通过预设的卷积神经网络提取所述原始语句的局部特征,通过预设的长短期记忆网络根据所述局部特征及其对应的上下文进行学习,获取综合特征,并对所述综合特征进行分类处理,获取概率特征,根据所述概率特征获取第二扩展语句;
[0008]将所述第一扩展语句与所述第二扩展语句进行融合,获取第三扩展语句,根据所述第三扩展语句与所述原始语句的相似度数值,获取所述原始语句对应的相似语句。
[0009]在其中一个实施例中,通过预设的卷积神经网络提取所述原始语句的局部特征的步骤包括:
[0010]对所述原始语句进行向量化处理,获取原始特征;
[0011]将所述原始特征输入所述卷积神经网络,对所述原始特征进行卷积处理,获取所述原始特征的局部特征。
[0012]在其中一个实施例中,根据预设的长短期记忆网络对所述局部特征及其对应的上下文进行学习,获取综合特征的步骤包括:
[0013]对所述局部特征进行池化处理,提取所述局部特征的特征图信息,获取第一特征,其中,所述第一特征包括:所述特征图信息中最大特征数值对应的所述局部特征;
[0014]将所述第一特征输入所述长短期记忆网络,进行迭代处理,获取第二特征;
[0015]根据所述第二特征与预设的注意力权重,获取所述综合特征。
[0016]在其中一个实施例中,对所述综合特征进行分类处理之前的步骤还包括:
[0017]将所述综合特征输入预设的门控循环神经网络,根据所述门控循环神经网络的重置门与更新门对所述综合特征进行更新,以使所述综合特征的双向信息得到汇总,获取更新后的所述综合特征。
[0018]在其中一个实施例中,获取所述原始语句对应的相似语句的步骤包括:
[0019]将所述第三扩展语句中所述第一扩展语句对应的所述相似度数值与预设的第一权重相乘,获取第一加权相似度数值;
[0020]将所述第三扩展语句中所述第二扩展语句对应的所述相似度数值与预设的第二权重相乘,获取第二加权相似度数值;
[0021]将所述第一加权相似度数值与所述第二加权相似度数值进行融合,获取第三加权相似度数值;
[0022]判断所述第三加权相似度数值是否大于预设的相似度阈值;
[0023]若是,则保存所述第三加权相似度数值对应的所述第三扩展语句,作为所述原始语句对应的所述相似语句。
[0024]在其中一个实施例中,所述方法还包括:
[0025]对所述原始语句进行质量评估处理,获取第一分数;
[0026]对所述相似语句进行质量评估处理,获取第二分数;
[0027]判断所述第一分数是否大于所述第二分数;
[0028]若是,则将所述相似语句存储至语料库,并从所述语料库中删除所述相似语句对应的所述原始语句。
[0029]在其中一个实施例中,对所述原始词汇进行同义词替换,获取第一扩展语句的步骤包括:
[0030]对所述原始词汇进行过滤处理,获取待扩展词汇,并按照预设的替换比例对所述待扩展词汇进行同义替换处理,获取第一扩展语句。
[0031]另一方面,提供了一种相似语句生成装置,所述相似语句生成装置包括:
[0032]第一处理模块,用于对所述原始语句进行分词处理,获取原始词汇,对所述原始词汇进行同义词替换,获取第一扩展语句;
[0033]第二处理模块,用于通过预设的卷积神经网络提取所述原始语句的局部特征,通过预设的长短期记忆网络对所述局部特征及其对应的上下文进行学习,获取综合特征,并对所述综合特征进行分类处理,获取概率特征,根据所述概率特征获取第二扩展语句;
[0034]相似语句获取模块,用于将所述第一扩展语句与所述第二扩展语句进行融合,获取第三扩展语句,根据所述第三扩展语句与所述原始语句的相似度数值,获取所述原始语句对应的相似语句。
[0035]再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0036]对所述原始语句进行分词处理,获取原始词汇,对所述原始词汇进行同义词替换,获取第一扩展语句;
[0037]通过预设的卷积神经网络提取所述原始语句的局部特征,通过预设的长短期记忆网络对所述局部特征及其对应的上下文进行学习,获取综合特征,并对所述综合特征进行分类处理,获取概率特征,根据所述概率特征获取第二扩展语句;
[0038]将所述第一扩展语句与所述第二扩展语句进行融合,获取第三扩展语句,根据所述第三扩展语句与所述原始语句的相似度数值,获取所述原始语句对应的相似语句。
[0039]又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0040]对所述原始语句进行分词处理,获取原始词汇,对所述原始词汇进行同义词替换,获取第一扩展语句;
[0041]通过预设的卷积神经网络提取所述原始语句的局部特征,通过预设的长短期记忆网络对所述局部特征及其对应的上下文进行学习,获取综合特征,并对所述综合特征进行分类处理,获取概率特征,根据所述概率特征获取第二扩展语句;
[0042]将所述第一扩展语句与所述第二扩展语句进行融合,获取第三扩展语句,根据所述第三扩展语句与所述原始语句的相似度数值,获取所述原始语句对应的相似语句。
[0043]上述一种相似语句生成方法、装置、计算机设备和存储介质,首先通过对原始语句进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相似语句生成方法,其特征在于,包括:对所述原始语句进行分词处理,获取原始词汇,对所述原始词汇进行同义词替换,获取第一扩展语句;通过预设的卷积神经网络提取所述原始语句的局部特征,通过预设的长短期记忆网络对所述局部特征及其对应的上下文进行学习,获取综合特征,并对所述综合特征进行分类处理,获取概率特征,根据所述概率特征获取第二扩展语句;将所述第一扩展语句与所述第二扩展语句进行融合,获取第三扩展语句,根据所述第三扩展语句与所述原始语句的相似度数值,获取所述原始语句对应的相似语句。2.根据权利要求1所述的方法,其特征在于,通过预设的卷积神经网络提取所述原始语句的局部特征的步骤包括:对所述原始语句进行向量化处理,获取原始特征;将所述原始特征输入所述卷积神经网络,对所述原始特征进行卷积处理,获取所述原始特征的局部特征。3.根据权利要求2所述的方法,其特征在于,根据预设的长短期记忆网络对所述局部特征及其对应的上下文进行学习,获取综合特征的步骤包括:对所述局部特征进行池化处理,提取所述局部特征的特征图信息,获取第一特征,其中,所述第一特征包括:所述特征图信息中最大特征数值对应的所述局部特征;将所述第一特征输入所述长短期记忆网络,进行迭代处理,获取第二特征;根据所述第二特征与预设的注意力权重,获取所述综合特征。4.根据权利要求1所述的方法,其特征在于,对所述综合特征进行分类处理之前的步骤还包括:将所述综合特征输入预设的门控循环神经网络,根据所述门控循环神经网络的重置门与更新门对所述综合特征进行更新,以使所述综合特征的双向信息得到汇总,获取更新后的所述综合特征。5.根据权利要求1所述的方法,其特征在于,获取所述原始语句对应的相似语句的步骤包括:将所述第三扩展语句中所述第一扩展语句对应的所述相似度数值与预设的第一权重相乘,获取第一加权相似度数值;将所述第三扩展语句中所述第二扩展语句对应的所述相似度数值与预设的第二权重相乘,...

【专利技术属性】
技术研发人员:谭应伟丁雪枫
申请(专利权)人:大众问问北京信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1