基于人工智能的文本生成方法、装置、设备及存储介质制造方法及图纸

技术编号:24996852 阅读:36 留言:0更新日期:2020-07-24 17:59
本申请实施例公开了一种基于人工智能的文本生成方法、装置、设备及存储介质,该方法包括:在获取到待生成文本的模板信息之后,可以先根据待生成文本的模板信息,确定待生成文本中各符号位置的格式信息;再根据待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到强文本生成模型输出的待生成文本中各符号位置的符号概率,并根据待生成文本中各符号位置的符号概率,确定待生成文本中各符号位置的符号,以便将待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。其中,因强文本生成模型能够基于各符号位置的格式信息,准确地确定出各符号位置的符号概率,使得本申请能够借助实现按照任一模板格式要求生成强模板文本的目的。

【技术实现步骤摘要】
基于人工智能的文本生成方法、装置、设备及存储介质
本申请涉及人工智能
,尤其涉及一种基于人工智能的文本生成方法、装置、设备及存储介质。
技术介绍
在一些应用场景(例如,对给定歌谱进行填词、或者对给定词牌名进行填词等应用场景)下,需要生成具有强模板的文本(例如,诗歌等文本)。其中,具有强模板的文本(下文简称为,强模板文本)是指表述所使用的模板格式比较固定的文本。为了便于理解具有强模板的文本,下面以具有强模板的五言绝句为例进行说明。五言绝句是中国传统诗歌的一种体裁,简称五绝;而且,五言绝句的格律(也就是模板格式)主要包括以下三种要求:①篇幅固定。全篇只有四句,每句五字,总共二十字。②押韵严格。一般只押平声韵且不能出韵,也就是说不可押仄韵且韵脚必须用同一韵中的字,不得用邻韵的字。③讲究平仄。具有“平平仄仄平”“仄仄平平仄”“平平平仄仄”“仄仄仄平平”四种基本句型,并由这四种句型按照粘对规则组合成“仄起首句不入韵”“仄起首句入韵”“平起首句不入韵”“平起首句入韵”四种基本格式。例如,对于王之涣的《登鹳雀楼》来说,因“白日依山尽,黄河入海流。欲穷千里目,更上一层楼。”的韵律为“仄仄平平仄,平平仄仄平。平平平仄仄,仄仄仄平平。”,使得王之涣的《登鹳雀楼》属于仄起首句不入韵式的格律。可见,五言绝句的模板格式比较固定,使得五言绝句属于具有强模板的文本。然而,如何按照用户提供的模板格式要求,生成符合该模板格式要求的文本仍是一亟待解决的技术问题。
技术实现思路
本申请实施例提供了一种基于人工智能的文本生成方法、装置、设备及存储介质,能够按照用户提供的模板格式,生成符合该模板格式的文本。有鉴于此,本申请第一方面提供了一种基于人工智能的文本生成方法,包括:获取待生成文本的模板信息;根据所述待生成文本的模板信息,确定所述待生成文本中各符号位置的格式信息;根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率;所述强文本生成模型是基于训练文本以及所述训练文本中各符号的格式信息训练得到的;根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号;将所述待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。本申请第二方面提供了一种基于人工智能的文本生成装置,包括:获取单元,用于获取待生成文本的模板信息;提取单元,用于根据所述待生成文本的模板信息,确定所述待生成文本中各符号位置的格式信息;生成单元,用于根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率;所述强文本生成模型是基于训练文本以及所述训练文本中各符号的格式信息训练得到的;确定单元,用于根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号;处理单元,用于将所述待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。本申请第三方面提供了一种设备,所述设备包括处理器以及存储器:所述存储器用于存储计算机程序;所述处理器用于根据所述计算机程序执行上述第一方面所述的基于人工智能的文本生成方法。本申请第四方面提供了计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的基于人工智能的文本生成方法。本申请第五方面提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行上述第一方面所述的基于人工智能的文本生成方法。从以上技术方案可以看出,本申请实施例具有以下优点:本申请实施例提供的基于人工智能的文本生成方法中,在获取到待生成文本的模板信息之后,可以先根据待生成文本的模板信息,确定待生成文本中各符号位置的格式信息;再根据待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到强文本生成模型输出的待生成文本中各符号位置的符号概率,并根据待生成文本中各符号位置的符号概率,确定待生成文本中各符号位置的符号,以便将待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。其中,因预先构建的强文本生成模型能够基于待生成文本中各符号位置的格式信息,准确地确定出待生成文本中各符号位置的符号概率,使得后续可以基于符号概率能够准确地确定出待生成文本中各符号位置的符号;还因用户提供的模板格式都可以细化到待生成文本中每个符号应该具有的格式信息,使得在获取到待生成文本的模板信息之后,可以先基于该模板信息准确地确定出待生成文本中各符号位置的格式信息,再利用预先构建的强文本生成模型准确地确定出待生成文本中各符号位置的符号概率,如此能够基于符号概率准确地确定出待生成文本中各符号位置的符号。可见,如此能够实现了按照用户提供的任一模板格式,生成符合该模板格式的文本的目的。附图说明图1为本申请实施例提供的基于人工智能的文本生成方法的一种应用场景示意图;图2为本申请实施例提供的基于人工智能的文本生成方法的另一种应用场景示意图;图3为本申请实施例提供的一种基于人工智能的文本生成方法的流程示意图;图4为本申请实施例提供的模板信息的示意图;图5为本申请实施例提供的待补全文本的示意图;图6为本申请实施例提供的基于人工智能的文本生成方法的另一种实施方式的流程示意图;图7为本申请实施例提供的强文本生成模型的训练过程的流程示意图;图8为本申请实施例提供的包括两层注意力层的强文本生成模型的训练示意图;图9为本申请实施例提供的应用于图1所示场景下的基于人工智能的文本生成方法的流程图;图10为本申请实施例提供的强模板文本生成指令的触发方式示意图;图11为本申请实施例提供的生成的强模板文本的显示示意图;图12为本申请实施例提供的一种基于人工智能的文本生成装置的结构示意图;图13为本申请实施例提供的另一种基于人工智能的文本生成装置的结构示意图;图14为本申请实施例提供的一种终端设备的结构示意图;图15为本申请实施例提供的一种服务器的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包本文档来自技高网
...

【技术保护点】
1.一种基于人工智能的文本生成方法,其特征在于,包括:/n获取待生成文本的模板信息;/n根据所述待生成文本的模板信息,确定所述待生成文本中各符号位置的格式信息;/n根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率;所述强文本生成模型是基于训练文本以及所述训练文本中各符号的格式信息训练得到的;/n根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号;/n将所述待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。/n

【技术特征摘要】
1.一种基于人工智能的文本生成方法,其特征在于,包括:
获取待生成文本的模板信息;
根据所述待生成文本的模板信息,确定所述待生成文本中各符号位置的格式信息;
根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率;所述强文本生成模型是基于训练文本以及所述训练文本中各符号的格式信息训练得到的;
根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号;
将所述待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。


2.根据权利要求1所述的方法,其特征在于,所述格式信息包括第一格式标识、第二格式标识和第三格式标识中的至少一种;所述第一格式标识用于表征符号类型及韵律信息;所述第二格式标识用于表征分句内部位置信息;所述第三格式标识用于表征分句位置信息。


3.根据权利要求1所述的方法,其特征在于,所述根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号,包括:
将所述待生成文本中各符号位置的符号概率进行校验,得到所述待生成文本中各符号位置的校验符号概率;
根据所述待生成文本中各符号位置的校验符号概率,确定所述待生成文本中各符号位置对应的候选符号;
根据所述待生成文本中各符号位置对应的候选符号,确定所述待生成文本中各符号位置的符号。


4.根据权利要求1所述的方法,其特征在于,所述强文本生成模型包括掩码自注意机制建模层和全局注意力机制建模层,所述掩码自注意机制建模层的输出数据是全局注意力机制建模层的输入数据。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待补全文本;
所述根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率,具体为:
根据所述待补全文本、所述待生成文本中各符号位置的格式信息、和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率。


6.根据权利要求1-5任一项所述的方法,...

【专利技术属性】
技术研发人员:李丕绩刘晓江
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1