文本重生成方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:25637239 阅读:20 留言:0更新日期:2020-09-15 21:29
本申请实施例公开了文本重生成方法、装置、电子设备和计算机可读介质。该方法的实施例包括:从目标对象关联的页面中获取目标对象的描述信息;从预设的知识图谱中获取目标对象关联的图谱信息;将描述信息和图谱信息进行汇总,生成输入信息序列;获取目标对象的约束信息,将输入信息序列和约束信息输入至预先训练的文本重生成模型,通过文本重生成模型从输入信息序列中抽取目标输入信息并将所抽取的目标输入信息汇总为目标名称,从而对目标对象的名称进行重生成。该实施方式提高了目标对象的名称的丰富性以及重生成的名称对目标对象的表达的准确性。

【技术实现步骤摘要】
文本重生成方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及文本重生成方法、装置、电子设备和计算机可读介质。
技术介绍
随着互联网技术的高速发展,互联网中的内容对象越来越丰富。各种内容对象需要具有相应的名称,如主题、标题等,以便于用户快速便捷地进行内容筛选和浏览。然而,现有的一些内容对象的名称较为简短,无法为用户提供足够的参考信息,导致用户需要进一步浏览详细信息才能确定是否为其所需的内容,给用户带来不便。例如,对于菜品对象,其名称通常为人为设定的简单菜名,如“酱牛肉”等,用户无法从当前的名称中得知更多信息。同时,这类内容对象的名称具有较高的准确性要求,若名称中出现不准确的词汇,极易给用户带来困扰。现有技术中,在对内容对象进行名称生成时,通常是从该内容对象的相关描述文本中筛选出关键词,或者相关描述文本中的内容生成新的关键词,进而将这些关键词组合为内容对象的名称。然而,这种名称生成方式所使用的信息来源较为单一,导致所生成的目标对象的名称中的信息不够丰富。此外,这种名称方式所得到名称中易出现不准确词汇,无法适用于菜品对象等对名称准确性要求较高的内容对象。
技术实现思路
本申请实施例提出了文本重生成方法、装置、电子设备和计算机可读介质,以提高目标对象的名称的丰富性以及重生成的名称对目标对象的表达的准确性。第一方面,本申请实施例提供了一种文本重生成方法,该方法包括:从目标对象关联的页面中,获取目标对象的描述信息,描述信息包括目标对象的原始名称;从预设的知识图谱中,获取目标对象关联的图谱信息;将描述信息和图谱信息进行汇总,生成输入信息序列;获取目标对象的约束信息,将输入信息序列和约束信息输入至预先训练的文本重生成模型,得到文本重生成模型对原始名称进行重生成后的目标名称,其中,文本重生成模型用于在约束信息的约束下,从输入信息序列中抽取目标输入信息,并将所抽取的目标输入信息汇总为目标名称,文本重生成模型采用机器学习方法对神经网络模型预先训练得到。第二方面,本申请实施例提供了一种文本重生成装置,该装置包括:第一获取单元,被配置成从目标对象关联的页面中,获取目标对象的描述信息,描述信息包括目标对象的原始名称;第二获取单元,被配置成从预设的知识图谱中,获取目标对象关联的图谱信息;汇总单元,被配置成将描述信息和图谱信息进行汇总,生成输入信息序列;重生成单元,被配置成获取目标对象的约束信息,将输入信息序列和约束信息输入至预先训练的文本重生成模型,得到文本重生成模型对原始名称进行重生成后的目标名称,其中,文本重生成模型用于在约束信息的约束下,从输入信息序列中抽取目标输入信息,并将所抽取的目标输入信息汇总为目标名称,文本重生成模型采用机器学习方法对神经网络模型预先训练得到。第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中所描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中所描述的方法。本申请实施例提供的文本重生成方法、装置、电子设备和计算机可读介质,通过从目标对象关联的页面中获取目标对象的描述信息,而后从预设的知识图谱中获取目标对象关联的图谱信息,从而将描述信息和图谱信息进行汇总,生成输入信息序列。而后通过获取目标对象的约束信息,并将输入信息序列和约束信息输入至预先训练的文本重生成模型,以通过文本重生成模型从输入信息序列中抽取目标输入信息并将所抽取的目标输入信息汇总为目标名称,从而实现对目标对象的名称进行重生成。一方面,由于目标对象关联的信息从多个数据来源处获取,且数据来源包括含有海量信息的知识图谱,因而信息来源较为丰富,有助于提高所生成的目标名称中的信息的丰富程度。另一方面,文本重生成模型在从输入信息序列中抽取目标输入信息时受到约束信息的约束,从而可以在抽取过程提供额外的信息以防止抽取到错误词语,提高了重生成的目标名称对目标对象的表达的准确性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是根据本申请的文本重生成方法的一个实施例的流程图;图2是根据本申请的神经网络模型的结构示意图;图3是根据本申请的通过文本重生成模型生成目标名称的流程图;图4是根据本申请的文本重生成装置的一个实施例的结构示意图;图5是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。请参考图1,其示出了根据本申请的文本重生成方法的一个实施例的流程100。文本重生成方法的执行主体可以是服务器。服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个设备组成的分布式设备集群,也可以实现成单个设备。当服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。此外,在终端设备具有实现本申请的文本重生成方法的能力时,信息获取方法的执行主体也可以是终端设备。上述终端设备可以是如手机、智能手机、平板电脑、膝上型便携计算机、可穿戴设备等的电子设备。该文本重生成方法,包括以下步骤:步骤101,从目标对象关联的页面中,获取目标对象的描述信息。在本实施例中,文本重生成方法的执行主体可以从目标对象关联的页面中,获取目标对象的描述信息。此处的目标对象可以是待进行重命名或者设定名称的任一内容对象,如文档、产品等。此处的产品既可以是实体产品,如菜品、饮品等,也可以是虚拟产品,如酒店房间等。此处的名称可以是标题、主题等内容。此处,目标对象关联的页面,可以是显示有目标对象的相关信息的页面。例如,若目标对象为一资讯,则目标对象关联的页面可以是显示有该资讯的详细内容的页面。若目标对象为一菜品,则目标对象关联的页面可以是该菜品的详情页。在本实施例中,目标对象的描述信息可以是用于描述目标对象的文本信息。此处的描述信息可以包括目标对象的原始名称。此外,描述信息还可以包含其他内容。例如,若目标对象为一资讯,则该资讯的描述信息除包括原始名称(或原始标题)外,还可包括该资讯的详细内容、发布时间、作者、关键词、摘要等信息。若目标对象为一资讯,则菜品的描述信息除包括原始的菜名外,还可包括该菜品的相关介绍、顾客评价等信息。在本实施例的一些可选的实现方式,上述执行主体可以通过如下步骤确定待进行重命名的目标对象:首先,获取多个对象的原始名称。例如,对于订餐平台,本文档来自技高网...

【技术保护点】
1.一种文本重生成方法,其特征在于,所述方法包括:/n从目标对象关联的页面中,获取所述目标对象的描述信息,所述描述信息包括所述目标对象的原始名称;/n从预设的知识图谱中,获取所述目标对象关联的图谱信息;/n将所述描述信息和所述图谱信息进行汇总,生成输入信息序列;/n获取所述目标对象的约束信息,将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,其中,所述文本重生成模型用于在所述约束信息的约束下,从输入信息序列中抽取目标输入信息,并将所抽取的目标输入信息汇总为目标名称,所述文本重生成模型采用机器学习方法对神经网络模型预先训练得到。/n

【技术特征摘要】
1.一种文本重生成方法,其特征在于,所述方法包括:
从目标对象关联的页面中,获取所述目标对象的描述信息,所述描述信息包括所述目标对象的原始名称;
从预设的知识图谱中,获取所述目标对象关联的图谱信息;
将所述描述信息和所述图谱信息进行汇总,生成输入信息序列;
获取所述目标对象的约束信息,将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,其中,所述文本重生成模型用于在所述约束信息的约束下,从输入信息序列中抽取目标输入信息,并将所抽取的目标输入信息汇总为目标名称,所述文本重生成模型采用机器学习方法对神经网络模型预先训练得到。


2.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括编码器、解码器和约束层,所述编码器包括编码层和注意力层;
所述编码层用于生成所述输入信息序列中的各信息的向量表示;
所述约束层用于生成所述约束信息的向量表示;
所述解码器用于基于从输入信息序列中依次抽取的目标输入信息和所述编码器上一次输出的隐向量,生成新的隐向量。
所述注意力层分别与所述编码层、所述解码器和所述约束层相连接,用于基于所述编码器的输出的各向量表示、所述约束层输出的向量表示和所述解码器逐次输出的隐向量,抽取所述输入信息序列中的目标输入信息。


3.根据权利要求2所述的方法,其特征在于,所述将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,包括:
将所述输入信息序列输入至所述编码层,得到编码向量序列,所述编码向量序列中包括所述输入信息序列中的各输入信息的向量表示;
将所述约束信息输入至所述约束层,得到所述约束信息的向量表示;
将起始符号的文本特征和位置特征输入至所述解码器,得到所述解码器输出的初始的隐向量;
执行如下文本重生成步骤:将所述编码向量序列、所述约束信息的向量表示和所述解码器最新输出的隐向量输入至所述注意力层;基于所述注意力层输出的信息,抽取所述输入信息序列中的目标输入信息;响应于检测出最新抽取目标输入信息为结束符号,将依次抽取的目标输入信息进行汇总,生成目标名称。


4.根据权利要求3所述的方法,其特征在于,所述注意力层输出的信息为概率向量,所述概率向量中的数值与所述输入信息序列中的输入信息一一对应,所述概率向量中的数值用于表征输入信息的抽取概率;以及,
所述基于所述注意力层输出的信息,抽取所述输入信息序列中的目标输入信息,包括:
将所述概率向量中的最大的数值对应的输入信息作为目标输入信息,抽取所述输入信息序列中的目标输入信息。


5.根据权利要求2所述的方法,其特征在于,所述将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,还包...

【专利技术属性】
技术研发人员:朱向荣
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1