System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本生成及模型训练方法、及计算机存储介质技术_技高网

文本生成及模型训练方法、及计算机存储介质技术

技术编号:42163921 阅读:21 留言:0更新日期:2024-07-27 00:12
本申请实施例提供了一种文本生成及模型训练方法、及计算机存储介质,涉及人工智能技术领域。其中,文本生成方法包括:获取用于生成格式文件的文本信息,及获取所述文本信息对应的提示信息;基于所述文本信息对应的所述提示信息,通过格式文件生成处理,获得对应的候选格式文件;从所述候选格式文件中进行预设的文本要素提取,获得对应的要素值;基于所述文本要素的要素值对所述候选格式文件进行文本要素检查,以根据检查结果,生成目标格式文件。该方法生成的目标格式文件的格式规范且内容准确。

【技术实现步骤摘要】

本申请实施例涉及人工智能,尤其涉及一种文本生成方法、一种模型训练方法、及一种计算机存储介质。


技术介绍

1、目前,人工智能技术在越来越多的行业和服务中得到应用。在众多人工智能技术中,文本生成是其中应用较多的一个分支。

2、基于人工智能技术的文本生成在诸如法律行业、医疗行业、金融行业等中,可以辅助实际工作,减轻用户(包括终端用户和工作人员等)的负担。例如,现有的基于人工智能技术的文本生成可以向用户提供相关的服务咨询和指导,针对用户问题给出答案,等等。这些辅助虽然从一定程度上为用户提供了方便,但在针对某一具体的任务时,其仍然只能从部分上提供辅助,还需要用户基于这些辅助的信息进行进一步的信息整理和补充,才能完成该任务。例如,用户在得到辅助的信息后,还需要填写相应的表格或格式文件,才能实现目标需求服务。


技术实现思路

1、有鉴于此,本申请实施例提供一种文本生成方案,以至少部分解决上述问题。

2、根据本申请实施例的第一方面,提供了一种文本生成方法,包括:获取用于生成格式文件的文本信息,及获取所述文本信息对应的提示信息;基于所述文本信息对应的所述提示信息,通过格式文件生成处理,获得对应的候选格式文件;从所述候选格式文件中进行预设的文本要素提取,获得对应的要素值;基于所述文本要素的要素值对所述候选格式文件进行文本要素检查,以根据检查结果,生成目标格式文件。

3、根据本申请实施例的第二方面,提供了一种文本生成方法,包括:获取用于生成法律格式文件的法律事件描述文本信息,及获取所述法律事件描述文本信息对应的提示信息;基于所述法律事件描述文本信息和所述提示信息,通过格式文件生成处理,获得对应的候选法律格式文件;从所述候选法律格式文件中提取预设的文本要素,获得对应的要素值;基于所述文本要素的要素值对所述候选法律格式文件进行文本要素检查,以根据检查结果,生成目标法律格式文件。

4、根据本申请实施例的第三方面,提供了一种模型训练方法,包括:获取用于进行训练的训练样本,其中,所述训练样本包括场景文本样本和与所述场景文本样本对应的格式文件模板样本,所述场景文本样本表示预设应用场景中的文本样本;使用所述训练样本,对经过预训练的生成式语言模型进行微调训练,以获得能够输出所述预设应用场景中的格式文件的文本生成模型。

5、根据本申请实施例的第四方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一到第三方面任一方面所述方法对应的操作。

6、根据本申请实施例的第五方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一到第三方面任一方面所述的方法。

7、根据本申请实施例的第六方面,提供了一种计算机程序产品,包括计算机程序/指令,其中,该计算机程序/指令被处理器执行时实现如第一到第三方面任一方面所述的方法步骤。

8、根据本申请实施例提供的方案,一方面,考虑到用户的最终需求,基于文本信息及描述用户需求的提示信息,来生成相应的格式文件,即候选格式文件。由此,直接满足用户需求,而无需用户再进行额外的诸如表格或格式文件填写的操作,既提高了文件生成效率,又有效满足了用户需求。另一方面,虽然候选格式文件已无需用户进行额外的操作,但是,为了保证生成的文件的准确性和规范性,本申请实施例的方案还基于候选格式文件进行文本要素检查,即,从候选格式文件中进行相应的文本要素提取,并根据得到的文本要素的要素值,对候选格式文件进行文本要素检查,以根据检查结果,生成目标格式文件。由此,能够保证生成的目标格式文件具有更好的准确性和规范性,提高格式文件生成质量。

本文档来自技高网...

【技术保护点】

1.一种文本生成方法,包括:

2.根据权利要求1所述的方法,其中,所述文本要素包括多个;所述基于所述文本要素的要素值对所述候选格式文件进行文本要素检查,包括:

3.根据权利要求1所述的方法,其中,所述获取所述文本信息对应的提示信息,包括:

4.根据权利要求1-3任一项所述的方法,其中,所述基于所述文本信息对应的所述提示信息,通过格式文件生成处理,获得对应的候选格式文件,包括:

5.根据权利要求4所述的方法,其中,所述文本生成模型的微调训练包括:

6.根据权利要求5所述的方法,其中,所述格式文件模板样本通过以下方式生成:

7.根据权利要求4所述的方法,其中,所述文本生成模型还连接有思维链检查器,所述思维链检查器用于基于思维链方式进行所述格式文本要素检查。

8.根据权利要求7所述的方法,其中,所述文本生成模型还用于从所述候选格式文件中提取预设的文本要素;所述思维链检查器基于思维链方式进行所述格式文本要素检查,包括:

9.一种文本生成方法,包括:

10.一种模型训练方法,包括:</p>

11.根据权利要求10所述的方法,其中,所述使用所述训练样本,对经过预训练的生成式语言模型进行微调训练,包括:

12.根据权利要求11所述的方法,其中,所述格式文件模板样本通过以下方式生成:

13.一种计算机程序产品,包括计算机程序/指令,其中,该计算机程序/指令被处理器执行时实现权利要求1-12任一项所述的方法步骤。

14.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-12中任一所述的方法。

...

【技术特征摘要】

1.一种文本生成方法,包括:

2.根据权利要求1所述的方法,其中,所述文本要素包括多个;所述基于所述文本要素的要素值对所述候选格式文件进行文本要素检查,包括:

3.根据权利要求1所述的方法,其中,所述获取所述文本信息对应的提示信息,包括:

4.根据权利要求1-3任一项所述的方法,其中,所述基于所述文本信息对应的所述提示信息,通过格式文件生成处理,获得对应的候选格式文件,包括:

5.根据权利要求4所述的方法,其中,所述文本生成模型的微调训练包括:

6.根据权利要求5所述的方法,其中,所述格式文件模板样本通过以下方式生成:

7.根据权利要求4所述的方法,其中,所述文本生成模型还连接有思维链检查器,所述思维链检查器用于基于思维链方式进行所述格式文本要素检查。

【专利技术属性】
技术研发人员:宋凯嵩康杨杨肖谦孙常龙
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1