干扰语句生成方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:29615249 阅读:13 留言:0更新日期:2021-08-10 18:30
本申请涉及智能决策和区块链技术领域,提供一种干扰语句生成方法、装置、设备及计算机可读存储介质,包括:获取样本数据,样本数据包括样本语句和真实同义语句;调用预设的干扰语句生成模型,将该样本语句和真实同义语句输入干扰语句生成模型,得到第二稠密向量和第三稠密向量,根据真实同义语句、预测同义语句、第二稠密向量和第三稠密向量,确定干扰语句生成模型是否收敛,若干扰语句生成模型未收敛,则更新干扰语句生成模型的参数,训练更新后的干扰语句生成模型至收敛。获取训练样本集,将训练样本集中的每个训练样本语句输入干扰语句生成模型,得到每个训练样本语句的第一干扰语句。提高了干扰语句集生成的准确性。

【技术实现步骤摘要】
干扰语句生成方法、装置、设备及计算机可读存储介质
本申请涉及智能决策
,尤其涉及一种干扰语句生成方法、装置、设备及计算机可读存储介质。
技术介绍
干扰文本生成是自然语言处理领域的重要研究领域,主要用于自动生成新闻、财报、训练数据集加强等方面,现有的干扰文本生成的方式普遍使用的方法是Transformer模型,但是该模型的损失函数在训练时只考虑了“局部”损失,即基于输入输出稀疏向量的损失比较,它仅能确保特定单词级别的适当性嵌入,但无法保证整个句子级别语义的正确表示。这使得在干扰文本生成应用场景中存在着较大的局限性,模型受数据集干扰明显,当训练数据不够充足时,模型只能生成有限的特定单词,但在语义层面容易出现表达混乱等问题。因此,如何更加准确生成样本集对应的干扰文本是目前亟待解决的问题。
技术实现思路
本申请的主要目的在于提供一种干扰语句生成方法、装置、设备及计算机可读存储介质,旨在提高生成干扰文本的准确性。第一方面,本申请提供一种干扰语句生成方法,包括:获取样本数据,所述样本数据包括样本语句和所述样本语句对应的真实同义语句;调用预设的干扰语句生成模型,其中,所述预设的干扰语句生成模型包括编码器、译码器和语义判别器;将所述样本语句输入所述编码器进行编码,得到第一稠密向量;将所述第一稠密向量输入所述译码器进行译码,得到预测同义语句;将所述真实同义语句输入所述语义判别器进行编码,得到第二稠密向量,并将所述预测同义语句输入所述语义判别器进行编码,得到第三稠密向量;根据所述真实同义语句、预测同义语句、第二稠密向量和第三稠密向量,确定所述干扰语句生成模型是否收敛;若所述干扰语句生成模型未收敛,则更新所述干扰语句生成模型的参数,并继续训练更新后的干扰语句生成模型至收敛;获取训练样本集,并将所述训练样本集中的每个训练样本语句输入收敛后的干扰语句生成模型进行处理,得到每个训练样本语句的第一干扰语句。第二方面,本申请还提供一种模型训练装置,所述模型训练装置包括:获取模块用于获取样本数据,所述样本数据包括样本语句和所述样本语句对应的真实同义语句;调用模块用于调用预设的干扰语句生成模型,其中,所述预设的干扰语句生成模型包括编码器、译码器和语义判别器;编码模块用于将所述样本语句输入所述编码器进行编码,得到第一稠密向量;译码模块用于将所述第一稠密向量输入所述译码器进行译码,得到预测同义语句;判别模块用于将所述真实同义语句输入所述语义判别器进行编码,得到第二稠密向量,并将所述预测同义语句输入所述语义判别器进行编码,得到第三稠密向量;确定模块用于根据所述真实同义语句、预测同义语句、第二稠密向量和第三稠密向量,确定所述干扰语句生成模型是否收敛;更新模块用于若所述干扰语句生成模型未收敛,则更新所述干扰语句生成模型的参数,并继续训练更新后的干扰语句生成模型至收敛;所述获取模块还用于获取训练样本集;生成模块用于将所述训练样本集中的每个训练样本语句输入收敛后的干扰语句生成模型进行处理,得到每个训练样本语句的第一干扰语句。第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的干扰语句生成方法的步骤。第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的干扰语句生成方法的步骤。本申请提供一种干扰语句生成方法、装置、设备及计算机可读存储介质,本申请获取样本数据,样本数据包括样本语句和样本语句对应的真实同义语句;调用预设的干扰语句生成模型,其中,预设的干扰语句生成模型包括编码器、译码器和语义判别器;将样本语句输入编码器进行编码,得到第一稠密向量;将第一稠密向量输入译码器进行译码,得到预测同义语句;将真实同义语句输入语义判别器进行编码,得到第二稠密向量,并将预测同义语句输入语义判别器进行编码,得到第三稠密向量;根据真实同义语句、预测同义语句、第二稠密向量和第三稠密向量,确定干扰语句生成模型是否收敛;若干扰语句生成模型未收敛,则更新干扰语句生成模型的参数,并继续训练更新后的干扰语句生成模型至收敛;获取训练样本集,并将训练样本集中的每个训练样本语句输入收敛后的干扰语句生成模型进行处理,得到每个训练样本语句的第一干扰语句。首先训练出干扰语句生成模型,然后将每个训练样本语句输入收敛后的干扰语句生成模型进行处理,得到准确的得到每个训练样本语句的第一干扰语句,极大地提高了干扰语句生成的准确性。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种干扰语句生成方法的步骤流程示意图;图2为图1中的干扰语句生成方法的子步骤流程示意图;图3为本申请实施例提供的干扰语句生成模型的一示意图框图;图4为本申请实施例提供的一种干扰语句生成装置的示意性框图;图5为图4中的干扰语句生成装置的子模块的示意性框图;图6为本申请实施例提供的一种计算机设备的结构示意性框图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。本申请实施例提供一种干扰语句生成方法、装置、设备及计算机可读存储介质。其中,该干扰语句生成方法可应用于计算机设备中。下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。请参照图1,图1为本申请实施例提供的一种干扰语句生成方法的步骤流程示意图。如图1所示,该干扰语句生成方法包括步骤S101至步骤S108。步骤S101、获取样本数据,所述样本数据包括样本语句和所述样本语句对应的真实同义语句。其中,样本数据包括样本语句和样本语句对应的真实同义句。示例性的,获取样本数据,该样本数据包括样本语句和样本语句对应的真实同义句,其中,该样本语句为Europeancountriesplayanimportantroleinworldeconomicdev本文档来自技高网...

【技术保护点】
1.一种干扰语句生成方法,其特征在于,包括:/n获取样本数据,所述样本数据包括样本语句和所述样本语句对应的真实同义语句;/n调用预设的干扰语句生成模型,其中,所述预设的干扰语句生成模型包括编码器、译码器和语义判别器;/n将所述样本语句输入所述编码器进行编码,得到第一稠密向量;/n将所述第一稠密向量输入所述译码器进行译码,得到预测同义语句;/n将所述真实同义语句输入所述语义判别器进行编码,得到第二稠密向量,并将所述预测同义语句输入所述语义判别器进行编码,得到第三稠密向量;/n根据所述真实同义语句、预测同义语句、第二稠密向量和第三稠密向量,确定所述干扰语句生成模型是否收敛;/n若所述干扰语句生成模型未收敛,则更新所述干扰语句生成模型的参数,并继续训练更新后的干扰语句生成模型至收敛;/n获取训练样本集,并将所述训练样本集中的每个训练样本语句输入收敛后的干扰语句生成模型进行处理,得到每个训练样本语句的第一干扰语句。/n

【技术特征摘要】
1.一种干扰语句生成方法,其特征在于,包括:
获取样本数据,所述样本数据包括样本语句和所述样本语句对应的真实同义语句;
调用预设的干扰语句生成模型,其中,所述预设的干扰语句生成模型包括编码器、译码器和语义判别器;
将所述样本语句输入所述编码器进行编码,得到第一稠密向量;
将所述第一稠密向量输入所述译码器进行译码,得到预测同义语句;
将所述真实同义语句输入所述语义判别器进行编码,得到第二稠密向量,并将所述预测同义语句输入所述语义判别器进行编码,得到第三稠密向量;
根据所述真实同义语句、预测同义语句、第二稠密向量和第三稠密向量,确定所述干扰语句生成模型是否收敛;
若所述干扰语句生成模型未收敛,则更新所述干扰语句生成模型的参数,并继续训练更新后的干扰语句生成模型至收敛;
获取训练样本集,并将所述训练样本集中的每个训练样本语句输入收敛后的干扰语句生成模型进行处理,得到每个训练样本语句的第一干扰语句。


2.如权利要求1所述的干扰语句生成方法,其特征在于,所述根据所述真实同义语句、预测同义语句、第二稠密向量和第三稠密向量,确定所述干扰语句生成模型是否收敛,包括:
根据所述真实同义语句和所述预测同义语句,确定第一损失值;
根据所述第二稠密向量和所述第三稠密向量,确定第二损失值;
根据所述第一损失值和所述第二损失值,确定目标损失值;
根据所述目标损失值,确定所述干扰语句生成模型是否收敛。


3.如权利要求2所述的干扰语句生成方法,其特征在于,所述根据所述真实同义语句和所述预测同义语句,确定第一损失值,包括:
确定所述样本语句中的词语数量;
对所述真实同义语句进行编码,得到第一编码向量,并对所述预测同义语句进行编码,得到第二编码向量;
根据所述第一编码向量、第二编码向量和样本词语数量,确定第一损失值。


4.如权利要求2所述的干扰语句生成方法,其特征在于,所述根据所述第一损失值和所述第二损失值,确定目标损失值,包括:
对所述第一损失值和第二损失值进行求和运算,得到当前损失值;
获取所述干扰语句生成模型的历史损失值和已训练总次数;
根据所述当前损失值、历史损失值和已训练总次数,确定所述目标损失值。


5.如权利要求4所述的干扰语句生成方法,其特征在于,所述根据所述当前损失值、历史损失值和已训练总次数,确定所述目标损失值,包括:
对所述当前损失值和所述历史损失值进行求和运算,得到总损失值;
将所述总损失值作...

【专利技术属性】
技术研发人员:王磊赵盟盟肖京苏亮州
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1