【技术实现步骤摘要】
文本重生成方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及文本重生成方法、装置、电子设备和计算机可读介质。
技术介绍
随着互联网技术的高速发展,互联网中的内容对象越来越丰富。各种内容对象需要具有相应的名称,如主题、标题等,以便于用户快速便捷地进行内容筛选和浏览。然而,现有的一些内容对象的名称较为简短,无法为用户提供足够的参考信息,导致用户需要进一步浏览详细信息才能确定是否为其所需的内容,给用户带来不便。例如,对于菜品对象,其名称通常为人为设定的简单菜名,如“酱牛肉”等,用户无法从当前的名称中得知更多信息。同时,这类内容对象的名称具有较高的准确性要求,若名称中出现不准确的词汇,极易给用户带来困扰。现有技术中,在对内容对象进行名称生成时,通常是从该内容对象的相关描述文本中筛选出关键词,或者相关描述文本中的内容生成新的关键词,进而将这些关键词组合为内容对象的名称。然而,这种名称生成方式所使用的信息来源较为单一,导致所生成的目标对象的名称中的信息不够丰富。此外,这种名称方式所得到名称中易出现不准确词汇,无法适用于菜品对象等对名称准确性要求较高的内容对象。
技术实现思路
本申请实施例提出了文本重生成方法、装置、电子设备和计算机可读介质,以提高目标对象的名称的丰富性以及重生成的名称对目标对象的表达的准确性。第一方面,本申请实施例提供了一种文本重生成方法,该方法包括:从目标对象关联的页面中,获取目标对象的描述信息,描述信息包括目标对象的原始名称;从预设的知识 ...
【技术保护点】
1.一种文本重生成方法,其特征在于,所述方法包括:/n从目标对象关联的页面中,获取所述目标对象的描述信息,所述描述信息包括所述目标对象的原始名称;/n从预设的知识图谱中,获取所述目标对象关联的图谱信息;/n将所述描述信息和所述图谱信息进行汇总,生成输入信息序列;/n获取所述目标对象的约束信息,将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,其中,所述文本重生成模型用于在所述约束信息的约束下,从输入信息序列中抽取目标输入信息,并将所抽取的目标输入信息汇总为目标名称,所述文本重生成模型采用机器学习方法对神经网络模型预先训练得到。/n
【技术特征摘要】
1.一种文本重生成方法,其特征在于,所述方法包括:
从目标对象关联的页面中,获取所述目标对象的描述信息,所述描述信息包括所述目标对象的原始名称;
从预设的知识图谱中,获取所述目标对象关联的图谱信息;
将所述描述信息和所述图谱信息进行汇总,生成输入信息序列;
获取所述目标对象的约束信息,将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,其中,所述文本重生成模型用于在所述约束信息的约束下,从输入信息序列中抽取目标输入信息,并将所抽取的目标输入信息汇总为目标名称,所述文本重生成模型采用机器学习方法对神经网络模型预先训练得到。
2.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括编码器、解码器和约束层,所述编码器包括编码层和注意力层;
所述编码层用于生成所述输入信息序列中的各信息的向量表示;
所述约束层用于生成所述约束信息的向量表示;
所述解码器用于基于从输入信息序列中依次抽取的目标输入信息和所述编码器上一次输出的隐向量,生成新的隐向量。
所述注意力层分别与所述编码层、所述解码器和所述约束层相连接,用于基于所述编码器的输出的各向量表示、所述约束层输出的向量表示和所述解码器逐次输出的隐向量,抽取所述输入信息序列中的目标输入信息。
3.根据权利要求2所述的方法,其特征在于,所述将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,包括:
将所述输入信息序列输入至所述编码层,得到编码向量序列,所述编码向量序列中包括所述输入信息序列中的各输入信息的向量表示;
将所述约束信息输入至所述约束层,得到所述约束信息的向量表示;
将起始符号的文本特征和位置特征输入至所述解码器,得到所述解码器输出的初始的隐向量;
执行如下文本重生成步骤:将所述编码向量序列、所述约束信息的向量表示和所述解码器最新输出的隐向量输入至所述注意力层;基于所述注意力层输出的信息,抽取所述输入信息序列中的目标输入信息;响应于检测出最新抽取目标输入信息为结束符号,将依次抽取的目标输入信息进行汇总,生成目标名称。
4.根据权利要求3所述的方法,其特征在于,所述注意力层输出的信息为概率向量,所述概率向量中的数值与所述输入信息序列中的输入信息一一对应,所述概率向量中的数值用于表征输入信息的抽取概率;以及,
所述基于所述注意力层输出的信息,抽取所述输入信息序列中的目标输入信息,包括:
将所述概率向量中的最大的数值对应的输入信息作为目标输入信息,抽取所述输入信息序列中的目标输入信息。
5.根据权利要求2所述的方法,其特征在于,所述将所述输入信息序列和所述约束信息输入至预先训练的文本重生成模型,得到所述文本重生成模型对所述原始名称进行重生成后的目标名称,还包...
【专利技术属性】
技术研发人员:朱向荣,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。