文本生成方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:34698147 阅读:8 留言:0更新日期:2022-08-27 16:34
本申请公开了一种文本生成方法、装置、计算机设备及计算机可读存储介质,涉及人工智能技术领域,利用上下文信息的关联,通过融合近邻词的概率,辅助输出质量高的文本。所述方法包括:获取待识别信息,确定多个样本上文向量;读取每个样本上文向量关联的样本下文信息,计算每个样本上文向量关联的样本下文信息的生成概率;获取语言生成模型,基于语言生成模型对待识别信息进行下文预测,得到多个预测下文信息以及每个预测下文信息的预测输出概率;确定文本内容一致的样本下文信息和预测下文信息,对生成概率和预测输出概率进行融合计算,得到融合概率;提取融合概率最大的目标样本下文信息作为待识别信息的下文生成结果进行输出。出。出。

【技术实现步骤摘要】
文本生成方法、装置、计算机设备及计算机可读存储介质


[0001]本申请涉及人工智能
,特别是涉及一种文本生成方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能技术的飞速发展,自然语言处理技术也不断创新,基于自然语言处理技术的人工智能被广泛应用于各种场景,比如语音识别、机器翻译、智能问答等场景。其中,基于自然语言处理技术的人工智能应用的核心在于语言生成模型,将需要识别的文本内容输入到语言生成模型后,语言生成模型便会对文本内容进行识别处理,生成相应的文本并输出。
[0003]相关技术中,语言生成模型通常基于Transformer(变换器)的架构设计,但是申请人认识到,Transformer模型所能处理的最大文本长度有限,使得在生成较长文本时,不得不将模型的输入进行截断,导致部分上下文信息丢失,影响文本生成的准确性,而且随着输入文本长度的增加,语言生成模型记住所有信息的难度也成指数级增长,在很多情况下,语言生成模型生成的新文本会大概率出现与之前重复甚至违背的情况,生成的文本质量较差。

技术实现思路

[0004]有鉴于此,本申请提供了一种文本生成方法、装置、计算机设备及计算机可读存储介质,主要目的在于解决目前影响文本生成的准确性,而且随着输入文本长度的增加,语言生成模型记住所有信息的难度也成指数级增长,在很多情况下,语言生成模型生成的新文本会大概率出现与之前重复甚至违背的情况,生成的文本质量较差的问题。
[0005]依据本申请第一方面,提供了一种文本生成方法,该方法包括:
[0006]获取待识别信息,确定多个样本上文向量,所述多个样本上文向量中每个样本上文向量与所述待识别信息的文本向量之间的距离满足预设距离条件;
[0007]读取所述每个样本上文向量关联的样本下文信息,计算所述每个样本上文向量关联的样本下文信息的生成概率;
[0008]获取语言生成模型,基于所述语言生成模型对所述待识别信息进行下文预测,得到多个预测下文信息以及每个预测下文信息的预测输出概率;
[0009]确定文本内容一致的样本下文信息和预测下文信息,对所述样本下文信息的生成概率和所述预测下文信息的预测输出概率进行融合计算,将计算得到的结果作为所述样本下文信息的融合概率;
[0010]在所述多个样本上文向量关联的多个样本下文信息中提取融合概率最大的目标样本下文信息,将所述目标样本下文信息作为所述待识别信息的下文生成结果进行输出。
[0011]可选地,所述获取待识别信息,确定多个样本上文向量,包括:
[0012]获取多个候选文本向量,所述多个候选文本向量中每个候选文本向量关联有样本
下文信息;
[0013]按照所述预设维度对所述待识别信息进行向量转换,得到所述待识别信息的文本向量;
[0014]分别计算所述多个候选文本向量中每个候选文本向量与所述待识别信息的文本向量之间的余弦相似性,以及将所述余弦相似性命中的距离作为向量距离,得到多个向量距离;
[0015]按照从小到大的顺序对所述多个向量距离进行排序,得到排序结果;
[0016]获取所述预设距离条件,在所述排序结果中提取排在队首且满足所述预设距离条件的多个目标向量距离,将所述多个目标向量距离对应的多个候选文本向量作为所述多个样本上文向量。
[0017]可选地,所述获取多个候选文本向量,包括:
[0018]采集多个样本文本,对所述多个样本文本中每个样本文本进行分句处理,得到多个样本语句;
[0019]对所述多个样本语句中每个样本语句执行以下处理:对所述样本语句进行分词处理,得到构成所述样本语句的多个词语,在所述多个词语中确定除位于末位的词语外的其他词语作为多个待处理词语,按照预设维度对所述多个待处理词语中每个待处理词语进行向量转换,得到多个待处理词语的多个词语向量,对所述多个词语向量进行聚合计算,将计算得到的向量作为所述样本语句的候选文本向量,将所述位于末位的词语作为所述样本语句的样本下文信息,以及将所述候选文本向量和所述样本下文信息进行关联存储;
[0020]获取基于所述多个样本语句生成的所述多个候选文本向量。
[0021]可选地,所述将所述候选文本向量和所述样本下文信息进行关联存储,包括:
[0022]将所述候选文本向量作为被索引的键,将所述样本下文信息作为值,生成将所述候选文本向量和所述样本下文信息关联的键值对,以及将所述键值对进行存储;
[0023]相应地,所述读取所述每个样本上文向量关联的样本下文信息,包括:
[0024]将所述每个样本上文向量作为用于索引的键进行键值对查询,得到多个键值对,以及分别读取所述多个键值对中每个键值对的值作为所述每个样本上文向量关联的样本下文信息。
[0025]可选地,所述计算所述每个样本上文向量关联的样本下文信息的生成概率,包括:
[0026]获取所述多个样本上文向量的多个样本下文信息,分别统计所述多个样本下文信息中每个样本下文信息的文本得分,得到多个文本得分;
[0027]计算所述多个文本得分的总和,分别计算所述每个样本下文信息的文本得分与所述总和的比值作为所述每个样本下文信息的生成概率。
[0028]可选地,所述方法还包括:
[0029]当所述多个样本下文信息中存在文本内容一致的至少两个样本下文信息时,分别计算所述至少两个样本下文信息中每个样本下文信息的文本得分与所述总和的比值,得到至少两个比值;
[0030]计算所述至少两个比值的和值,将所述和值作为文本内容一致的至少两个样本下文信息的生成概率。
[0031]可选地,所述对所述样本下文信息的生成概率和所述预测下文信息的预测输出概
率进行融合计算,将计算得到的结果作为所述样本下文信息的融合概率,包括:
[0032]获取预设调节参数,计算1与所述预设调节参数的差值;
[0033]计算所述预设调节参数与所述生成概率的第一乘积,计算所述差值与所述预测输出概率的第二乘积;
[0034]计算所述第一乘积与所述第二乘积的和值,将所述和值作为所述生成概率和所述预测输出概率进行融合计算的结果,以及将所述结果作为所述融合概率。
[0035]依据本申请第二方面,提供了一种文本生成装置,该装置包括:
[0036]获取模块,用于获取待识别信息,确定多个样本上文向量,所述多个样本上文向量中每个样本上文向量与所述待识别信息的文本向量之间的距离满足预设距离条件;
[0037]计算模块,用于读取所述每个样本上文向量关联的样本下文信息,计算所述每个样本上文向量关联的样本下文信息的生成概率;
[0038]预测模块,用于获取语言生成模型,基于所述语言生成模型对所述待识别信息进行下文预测,得到多个预测下文信息以及每个预测下文信息的预测输出概率;
[0039]所述计算模块,还用于确定文本内容一致的样本下文信息和预测下文信息,对所述样本下文信息的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本生成方法,其特征在于,包括:获取待识别信息,确定多个样本上文向量,所述多个样本上文向量中每个样本上文向量与所述待识别信息的文本向量之间的距离满足预设距离条件;读取所述每个样本上文向量关联的样本下文信息,计算所述每个样本上文向量关联的样本下文信息的生成概率;获取语言生成模型,基于所述语言生成模型对所述待识别信息进行下文预测,得到多个预测下文信息以及每个预测下文信息的预测输出概率;确定文本内容一致的样本下文信息和预测下文信息,对所述样本下文信息的生成概率和所述预测下文信息的预测输出概率进行融合计算,将计算得到的结果作为所述样本下文信息的融合概率;在所述多个样本上文向量关联的多个样本下文信息中提取融合概率最大的目标样本下文信息,将所述目标样本下文信息作为所述待识别信息的下文生成结果进行输出。2.根据权利要求1所述的方法,其特征在于,所述获取待识别信息,确定多个样本上文向量,包括:获取多个候选文本向量,所述多个候选文本向量中每个候选文本向量关联有样本下文信息;按照所述预设维度对所述待识别信息进行向量转换,得到所述待识别信息的文本向量;分别计算所述多个候选文本向量中每个候选文本向量与所述待识别信息的文本向量之间的余弦相似性,以及将所述余弦相似性命中的距离作为向量距离,得到多个向量距离;按照从小到大的顺序对所述多个向量距离进行排序,得到排序结果;获取所述预设距离条件,在所述排序结果中提取排在队首且满足所述预设距离条件的多个目标向量距离,将所述多个目标向量距离对应的多个候选文本向量作为所述多个样本上文向量。3.根据权利要求2所述的方法,其特征在于,所述获取多个候选文本向量,包括:采集多个样本文本,对所述多个样本文本中每个样本文本进行分句处理,得到多个样本语句;对所述多个样本语句中每个样本语句执行以下处理:对所述样本语句进行分词处理,得到构成所述样本语句的多个词语,在所述多个词语中确定除位于末位的词语外的其他词语作为多个待处理词语,按照预设维度对所述多个待处理词语中每个待处理词语进行向量转换,得到多个待处理词语的多个词语向量,对所述多个词语向量进行聚合计算,将计算得到的向量作为所述样本语句的候选文本向量,将所述位于末位的词语作为所述样本语句的样本下文信息,以及将所述候选文本向量和所述样本下文信息进行关联存储;获取基于所述多个样本语句生成的所述多个候选文本向量。4.根据权利要求3所述的方法,其特征在于,所述将所述候选文本向量和所述样本下文信息进行关联存储,包括:将所述候选文本向量作为被索引的键,将所述样本下文信息作为值,生成将所述候选文本向量和所述样本下文信息关联的键值对,以及将所述键值对进行存储;相应地,所述读取所述每个样本上文向量关联的样本下文信息,包括:
将所述每个样本上文向量...

【专利技术属性】
技术研发人员:谯轶轩
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1