【技术实现步骤摘要】
本公开涉及自然语言处理,具体而言,涉及一种文本的生成方法、文本的生成装置、电子设备及计算机程序产品。
技术介绍
1、检索增强型生成系统是自然语言处理中用于提升文本生成任务性能的关键技术。在目前的检索增强型生成系统中,面对开放域问答和事实验证等知识密集型语言任务时,常常会出现信息的过载和不相关性问题。
2、这些系统通常依赖于大规模数据检索,但由于检索算法的不完善,经常会检索到与查询部分或完全不相关的信息,导致生成模型产生不准确或与上下文无关的输出。此外,现有方法在处理检索到的信息时往往缺乏有效的过滤机制,使得生成内容易受干扰信息的影响,从而影响整体的生成质量。
3、鉴于此,本领域亟需一种文本的生成方法,能够提高信息过滤的精确性,减少信息干扰,优化文本生成的结果。
4、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本公开的目的在于提供一种文本的生成方法、文本的生成装置、电子设备及计算机程序产品,进而至少在一定程度上能够提高信息过滤的精确性,减少信息干扰,优化文本生成的结果。
2、根据本公开的第一个方面,提供一种文本的生成方法,包括:
3、获取用户的输入文本,并根据所述输入文本得到与所述输入文本相关的候选文本;
4、将所述输入文本和所述候选文本输入文本过滤模型中,其中,所述文本过滤模型中包括字符匹配子模型、相似
5、通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果;
6、根据各个所述子模型的过滤结果得到所述输入文本对应的目标匹配文本,并根据所述目标匹配文本生成所述输入文本对应的输出文本。
7、在本公开的一种示例性实施例中,在所述子模型为所述字符匹配子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
8、确定所述输入文本和所述候选文本中每个字符分别对应的加权系数,并根据每个字符分别对应的质数映射和所述加权系数,得到每个字符分别对应的哈希值;
9、根据所述输入文本中每个字符分别对应的哈希值以及所述候选文本中每个字符分别对应的哈希值,得到所述输入文本和所述候选文本的匹配值;
10、根据所述输入文本和所述候选文本的匹配值,得到所述字符匹配子模型针对所述候选文本的过滤结果。
11、在本公开的一种示例性实施例中,在所述子模型为所述相似度匹配子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
12、根据所述输入文本和所述候选文本中每个词汇分别得到对应的词嵌入向量;
13、根据每个词汇的词嵌入向量和词汇权重,得到所述输入文本和所述候选文本的相似度;
14、根据所述输入文本和所述候选文本的相似度,得到所述相似度匹配子模型针对所述候选文本的过滤结果。
15、在本公开的一种示例性实施例中,在所述子模型为所述互依性度量子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
16、获取与所述输入文本相关的条件变量,确定在给定所述条件变量的情况下,所述输入文本和所述候选文本分别对应的条件概率分布;
17、根据所述条件概率分布,以及所述输入文本、所述候选文本和所述条件变量的联合概率分布,得到所述输入文本和所述候选文本的共享信息量;
18、根据所述输入文本和所述候选文本的共享信息量,得到所述互依性度量子模型针对所述候选文本的过滤结果。
19、在本公开的一种示例性实施例中,所述根据所述输入文本得到与所述输入文本相关的候选文本,包括:
20、基于预设的搜索算法,从预设的文本集中搜索与所述输入文本相关的候选文本。
21、在本公开的一种示例性实施例中,在从预设的文本集中搜索与所述输入文本相关的候选文本之前,所述方法还包括:
22、对用户的输入文本进行预处理,得到预处理后的格式化的输入文本。
23、在本公开的一种示例性实施例中,所述根据所述目标匹配文本生成所述输入文本对应的输出文本,包括:
24、将所述目标匹配文本输入生成模型中,得到所述输入文本对应的输出文本。
25、根据本公开的第二方面,提供一种文本的生成装置,包括:
26、候选文本获取模块,用于获取用户的输入文本,并根据所述输入文本得到与所述输入文本相关的候选文本;
27、过滤模型输入模块,用于将所述输入文本和所述候选文本输入文本过滤模型中,其中,所述文本过滤模型中包括字符匹配子模型、相似度匹配子模型和互依性度量子模型;
28、候选文本过滤模块,用于通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果;
29、输出文本生成模块,用于根据各个所述子模型的过滤结果得到所述输入文本对应的目标匹配文本,并根据所述目标匹配文本生成所述输入文本对应的输出文本。
30、根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的文本的生成方法。
31、根据本公开的第四方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的文本的生成方法。
32、本公开示例性实施例可以具有以下有益效果:
33、本公开示例实施方式的文本的生成方法中,通过动态评估文本的相关性,精确过滤不相关信息,确保文本生成过程中只传递关键内容,不仅有效减少信息过载和干扰,还显著提高了生成内容的准确性和相关性,大幅提升生成质量,有效减少文本生成过程中的错误及信息幻觉现象,从而显著提高信息密集型语言任务的处理效果,解决生成系统在处理开放域问答和事实验证任务中,由于检索系统不完善引起的信息过载与不相关信息的干扰问题。在实际应用中,上述文本的生成方法能够有效提升文本生成的质量与效率,使系统在处理多样化、复杂化的信息时具备更强的应对能力,特别适用于开放域问答和事实验证等复杂的知识密集型任务,能够为用户提供更加智能和优质的服务体验。
34、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
本文档来自技高网...【技术保护点】
1.一种文本的生成方法,其特征在于,包括:
2.根据权利要求1所述的文本的生成方法,其特征在于,在所述子模型为所述字符匹配子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
3.根据权利要求1所述的文本的生成方法,其特征在于,在所述子模型为所述相似度匹配子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
4.根据权利要求1所述的文本的生成方法,其特征在于,在所述子模型为所述互依性度量子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
5.根据权利要求1所述的文本的生成方法,其特征在于,所述根据所述输入文本得到与所述输入文本相关的候选文本,包括:
6.根据权利要求5所述的文本的生成方法,其特征在于,在从预设的文本集中搜索与所述输入文本相关的候选文本之前,所述方法还包括:
7.根据权利要求1所述的文本的生成方法,其特征在于,所述根据所述目标匹配文本生成所
8.一种文本的生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的文本的生成方法。
...【技术特征摘要】
1.一种文本的生成方法,其特征在于,包括:
2.根据权利要求1所述的文本的生成方法,其特征在于,在所述子模型为所述字符匹配子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
3.根据权利要求1所述的文本的生成方法,其特征在于,在所述子模型为所述相似度匹配子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
4.根据权利要求1所述的文本的生成方法,其特征在于,在所述子模型为所述互依性度量子模型时,所述通过所述文本过滤模型中的子模型对所述候选文本进行过滤,得到所述子模型对应的过滤结果,包括:
【专利技术属性】
技术研发人员:王昊,章祺,杨明川,李馨迟,吕莹,
申请(专利权)人:中国电信股份有限公司技术创新中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。