模型训练及文案生成方法、装置、设备及存储介质制造方法及图纸

技术编号:37787448 阅读:17 留言:0更新日期:2023-06-09 09:17
本发明专利技术提供了模型训练及文案生成方法、装置、设备及存储介质,通过从旅游线路数据中抽取多个兴趣点实体的知识信息,将多个兴趣点实体的知识信息输入知识表示模型,输出每个兴趣点实体的知识嵌入向量,知识信息中包含兴趣点实体及兴趣点实体之间的关联信息,将知识嵌入向量和旅游线路数据对应的文本标题输入文案生成模型,输出旅游线路数据所对应的文案。在本公开实施例中,知识嵌入向量提供了不同兴趣点实体之间的连接信息,因此知识嵌入向量可以刻画兴趣点实体之间的语义关联,这样文案生成模型能够结合兴趣点实体之间的关联信息生成更具有概括性和精确度的文案词,给用户带来良好的使用体验。好的使用体验。好的使用体验。

【技术实现步骤摘要】
模型训练及文案生成方法、装置、设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种模型训练及文案生成方法、装置、设备及存储介质。

技术介绍

[0002]在旅游业务场景中,具有给旅游线路生成相应的文案词或文案句的需求,以吸引游客的兴趣,提高线路的点击率。目前的文案生成主要依赖人工通过互联网搜索信息流,比较费时费力。通过应用自然语言生成NLG(Natural

language generation)算法,可以生成指定类型的文本,以达到节约人力的目的。
[0003]因此,如何生成精确的文案,是业界普遍考虑的课题。
[0004]需要说明的是,上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]针对现有技术中的问题,本专利技术的目的在于提供模型训练及文案生成方法、装置、设备及存储介质,克服了现有技术的困难,能够提升生成文案的精确度。
[0006]本公开实施例提供一种模型训练方法,其包括:
[0007]从兴趣点实体表中获取训练旅游线路中所有兴趣点实体的知识信息,知识信息中包含兴趣点实体及兴趣点实体之间的关联信息;
[0008]利用知识信息训练知识表示模型,直到达到第一训练停止条件;
[0009]利用训练好的知识表示模型输出的兴趣点实体的知识嵌入向量和兴趣点实体对应的文本标题训练文案生成模型,直到达到第二训练停止条件。
[0010]可选地,利用训练好的知识表示模型输出的兴趣点实体的知识嵌入向量和兴趣点实体对应的文本标题训练文案生成模型,包括:
[0011]根据兴趣点实体的文本长度对相应的知识嵌入向量复制对应次数;
[0012]对文本标题进行编码以得到文本表示向量,将复制后的知识嵌入向量与文本表示向量中对应兴趣点实体的向量进行线性相加,得到最终的嵌入向量;
[0013]将最终的嵌入向量输入文案生成模型并训练文案生成模型,直到达到第二训练条件。
[0014]可选地,关联信息包括兴趣点实体的位置信息、兴趣点实体的类型信息中的一种或两种。
[0015]本公开实施例还提供一种文案生成方法,其包括:
[0016]从旅游线路数据中抽取多个兴趣点实体的知识信息,将多个兴趣点实体的知识信息输入知识表示模型,输出每个兴趣点实体的知识嵌入向量,知识信息中包含兴趣点实体及兴趣点实体之间的关联信息;
[0017]将知识嵌入向量和旅游线路数据对应的文本标题输入文案生成模型,输出旅游线
路数据所对应的文案。
[0018]可选地,关联信息包括兴趣点实体的位置信息及兴趣点实体的类型信息中的一种或两种。
[0019]可选地,将知识嵌入向量和旅游线路数据对应的文本标题输入文案生成模型,输出旅游线路数据所对应的文案,包括:
[0020]根据兴趣点实体的文本长度对相应的知识嵌入向量复制对应次数;
[0021]对文本标题进行编码以得到文本表示向量,将复制后的知识嵌入向量与文本表示向量中对应兴趣点实体的向量进行线性相加,得到最终的嵌入向量;
[0022]将最终的嵌入向量输入文案生成模型,输出旅游线路数据对应的文案。
[0023]本公开实施例还提供一种模型训练装置,其包括:
[0024]获取模块,从兴趣点实体表中获取训练旅游线路中所有兴趣点实体的知识信息,知识信息中包含兴趣点实体及兴趣点实体之间的关联信息;
[0025]第一训练模块,利用知识信息训练知识表示模型,直到达到第一训练停止条件;
[0026]第二训练模块,利用训练好的知识表示模型输出的兴趣点实体的知识嵌入向量和兴趣点实体对应的文本标题训练文案生成模型,直到达到第二训练停止条件。
[0027]本公开实施例还提供一种文案生成装置,其包括:
[0028]知识表示模块,从旅游线路数据中抽取多个兴趣点实体的知识信息,将多个兴趣点实体的知识信息输入知识表示模型,输出每个兴趣点实体的知识嵌入向量,知识信息中包含兴趣点实体及兴趣点实体之间的关联信息;
[0029]文案生成模块,将知识嵌入向量和旅游线路数据对应的文本标题输入文案生成模型,输出旅游线路数据所对应的文案。
[0030]本专利技术的实施例还提供一种电子设备,包括:
[0031]处理器;
[0032]存储器,其中存储有处理器的可执行指令;
[0033]其中,处理器配置为经由执行可执行指令来执行上述模型训练方法或文案生成方法的步骤。
[0034]本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现上述模型训练方法或文案生成方法的步骤。
[0035]本专利技术的模型训练及文案生成方法、装置、设备及存储介质,通过从旅游线路数据中抽取多个兴趣点实体的知识信息,将多个兴趣点实体的知识信息输入知识表示模型,输出每个兴趣点实体的知识嵌入向量,知识信息中包含兴趣点实体及兴趣点实体之间的关联信息,将知识嵌入向量和旅游线路数据对应的文本标题输入文案生成模型,输出旅游线路数据所对应的文案。在本公开实施例中,知识嵌入向量提供了不同兴趣点实体之间的连接信息,因此知识嵌入向量可以刻画兴趣点实体之间的语义关联,这样文案生成模型能够结合兴趣点实体之间的关联信息生成更具有概括性和精确度的文案词,给用户带来良好的使用体验。
附图说明
[0036]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、
目的和优点将会变得更明显。
[0037]图1是本公开实施例的模型训练方法的流程图。
[0038]图2展示本公开实施例的文案生成模型的原理示意图。
[0039]图3展示本公开实施例的文案生成方法的流程图。
[0040]图4是本公开实施例的模型训练装置的结构示意图。
[0041]图5是本公开实施例的文案生成装置的结构示意图。
[0042]图6是本专利技术的电子设备的结构示意图。以及
[0043]图7是本专利技术一实施例的计算机可读存储介质的结构示意图。
具体实施方式
[0044]以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本申请所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用系统,本申请中的各项细节也可以根据不同观点与应用系统,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0045]下面以附图为参考,针对本申请的实施例进行详细说明,以便本申请所属
的技术人员能够容易地实施。本申请可以以多种不同形态体现,并不限定于此处说明的实施例。
[0046]现有的NLG方法主要是通过预训练语言模型来生成文本,这可应用于旅游线路中的文案词生成。但是,在旅游线路文案生成场景中,由于单一线路可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:从兴趣点实体表中获取训练旅游线路中所有兴趣点实体的知识信息,所述知识信息中包含兴趣点实体及兴趣点实体之间的关联信息;利用所述知识信息训练知识表示模型,直到达到第一训练停止条件;利用训练好的所述知识表示模型输出的兴趣点实体的知识嵌入向量和所述兴趣点实体对应的文本标题训练文案生成模型,直到达到第二训练停止条件。2.根据权利要求1所述的模型训练方法,其特征在于,所述利用训练好的所述知识表示模型输出的兴趣点实体的知识嵌入向量和所述兴趣点实体对应的文本标题训练文案生成模型,包括:根据所述兴趣点实体的文本长度对相应的知识嵌入向量复制对应次数;对所述文本标题进行编码以得到文本表示向量,将复制后的所述知识嵌入向量与所述文本表示向量中对应所述兴趣点实体的向量进行线性相加,得到最终的嵌入向量;将所述最终的嵌入向量输入所述文案生成模型并训练所述文案生成模型,直到达到第二训练条件。3.根据权利要求1所述的模型训练方法,其特征在于,所述关联信息包括所述兴趣点实体的位置信息、所述兴趣点实体的类型信息中的一种或两种。4.一种文案生成方法,其特征在于,包括:从旅游线路数据中抽取多个兴趣点实体的知识信息,将所述多个兴趣点实体的知识信息输入知识表示模型,输出每个兴趣点实体的知识嵌入向量,所述知识信息中包含兴趣点实体及兴趣点实体之间的关联信息;将所述知识嵌入向量和所述旅游线路数据对应的文本标题输入文案生成模型,输出所述旅游线路数据所对应的文案。5.根据权利要求4所述的文案生成方法,其特征在于,所述关联信息包括所述兴趣点实体的位置信息及所述兴趣点实体的类型信息中的一种或两种。6.根据权利要求4所述的文案生成方法,其特征在于,所述将所述知识嵌入向量和所述旅游线路数据对应的文本标题输入文案生成模型,输出所述旅游线路...

【专利技术属性】
技术研发人员:韩雨鞠剑勋李健
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1