【技术实现步骤摘要】
基于人工智能的文本生成方法、装置、设备及存储介质
本申请涉及人工智能
,尤其涉及一种基于人工智能的文本生成方法、装置、设备及存储介质。
技术介绍
在一些应用场景(例如,对给定歌谱进行填词、或者对给定词牌名进行填词等应用场景)下,需要生成具有强模板的文本(例如,诗歌等文本)。其中,具有强模板的文本(下文简称为,强模板文本)是指表述所使用的模板格式比较固定的文本。为了便于理解具有强模板的文本,下面以具有强模板的五言绝句为例进行说明。五言绝句是中国传统诗歌的一种体裁,简称五绝;而且,五言绝句的格律(也就是模板格式)主要包括以下三种要求:①篇幅固定。全篇只有四句,每句五字,总共二十字。②押韵严格。一般只押平声韵且不能出韵,也就是说不可押仄韵且韵脚必须用同一韵中的字,不得用邻韵的字。③讲究平仄。具有“平平仄仄平”“仄仄平平仄”“平平平仄仄”“仄仄仄平平”四种基本句型,并由这四种句型按照粘对规则组合成“仄起首句不入韵”“仄起首句入韵”“平起首句不入韵”“平起首句入韵”四种基本格式。例如,对于王之涣的《登鹳雀楼》来说,因“白 ...
【技术保护点】
1.一种基于人工智能的文本生成方法,其特征在于,包括:/n获取待生成文本的模板信息;/n根据所述待生成文本的模板信息,确定所述待生成文本中各符号位置的格式信息;/n根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率;所述强文本生成模型是基于训练文本以及所述训练文本中各符号的格式信息训练得到的;/n根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号;/n将所述待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。/n
【技术特征摘要】
1.一种基于人工智能的文本生成方法,其特征在于,包括:
获取待生成文本的模板信息;
根据所述待生成文本的模板信息,确定所述待生成文本中各符号位置的格式信息;
根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率;所述强文本生成模型是基于训练文本以及所述训练文本中各符号的格式信息训练得到的;
根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号;
将所述待生成文本中各符号位置的符号按照符号位置排序组合,得到待生成文本。
2.根据权利要求1所述的方法,其特征在于,所述格式信息包括第一格式标识、第二格式标识和第三格式标识中的至少一种;所述第一格式标识用于表征符号类型及韵律信息;所述第二格式标识用于表征分句内部位置信息;所述第三格式标识用于表征分句位置信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待生成文本中各符号位置的符号概率,确定所述待生成文本中各符号位置的符号,包括:
将所述待生成文本中各符号位置的符号概率进行校验,得到所述待生成文本中各符号位置的校验符号概率;
根据所述待生成文本中各符号位置的校验符号概率,确定所述待生成文本中各符号位置对应的候选符号;
根据所述待生成文本中各符号位置对应的候选符号,确定所述待生成文本中各符号位置的符号。
4.根据权利要求1所述的方法,其特征在于,所述强文本生成模型包括掩码自注意机制建模层和全局注意力机制建模层,所述掩码自注意机制建模层的输出数据是全局注意力机制建模层的输入数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待补全文本;
所述根据所述待生成文本中各符号位置的格式信息和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率,具体为:
根据所述待补全文本、所述待生成文本中各符号位置的格式信息、和预先构建的强文本生成模型,得到所述强文本生成模型输出的所述待生成文本中各符号位置的符号概率。
6.根据权利要求1-5任一项所述的方法,...
【专利技术属性】
技术研发人员:李丕绩,刘晓江,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。