摘要生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24853531 阅读:26 留言:0更新日期:2020-07-10 19:07
本公开实施例公开了一种摘要生成方法、装置、电子设备及存储介质。所述方法包括:获取至少一个源文本;获取至少一个目标语言;将至少一个源文本和与各所述目标语言匹配的指示信息输入到预先训练的摘要生成模型中,所述摘要生成模型用于将至少一个第一文本简化为至少一个第二文本,同时将各所述第一文本对应的第一语言集合中的语言分别翻译成第二语言集合中的至少一个语言,并分别作为各所述第二文本对应的语言,所述第一语言集合包括多个语言;所述第二语言集合包括多个语言;获取所述摘要生成模型输出的分别与各所述目标语言对应的摘要文本。本公开实施例可以提高摘要生成的效率和准确性。

【技术实现步骤摘要】
摘要生成方法、装置、电子设备及存储介质
本公开实施例涉及文本识别领域,尤其涉及一种摘要生成方法、装置、电子设备及存储介质。
技术介绍
目前,随着网络的发展,人们可以方便的获取国际文档并进行阅读。但读者在对国际文档进行阅读时,其中包含的大量文本数据以及非母语语言使得读者花费大量时间进行浏览阅读。目前可以从原始语言的文档提取关键信息并生成原始语言的摘要,再将原始语言的摘要翻译生成目标语言的摘要,使读者快速了解文档的内容,进而决定是否继续深入阅读该文档。上述文档摘要生成方法,仅能针对只能支持一种语言到另外一种语言的翻译。此时,如果存在相似内容的不同语言的文章,则需要分别进行提取摘要并翻译,无法快速获取相似内容的多个文章的关键信息。
技术实现思路
本公开实施例提供一种摘要生成方法、装置、电子设备及存储介质,可以提高摘要生成的效率和准确性。第一方面,本公开实施例提供了一种摘要生成方法,包括:获取至少一个源文本;获取至少一个目标语言;将至少一个源文本和与各所述目标语言匹配的指示信息输入到预本文档来自技高网...

【技术保护点】
1.一种摘要生成方法,其特征在于,包括:/n获取至少一个源文本;/n获取至少一个目标语言;/n将至少一个源文本和与各所述目标语言匹配的指示信息输入到预先训练的摘要生成模型中,所述摘要生成模型用于将至少一个第一文本简化为至少一个第二文本,同时将各所述第一文本对应的第一语言集合中的语言分别翻译成第二语言集合中的至少一个语言,并分别作为各所述第二文本对应的语言,所述第一语言集合包括多个语言,所述第一语言集合包括各所述源文本分别对应的待翻译语言,所述第二语言集合包括多个语言,所述第二语言集合包括各所述目标语言;/n获取所述摘要生成模型输出的分别与各所述目标语言对应的摘要文本。/n

【技术特征摘要】
1.一种摘要生成方法,其特征在于,包括:
获取至少一个源文本;
获取至少一个目标语言;
将至少一个源文本和与各所述目标语言匹配的指示信息输入到预先训练的摘要生成模型中,所述摘要生成模型用于将至少一个第一文本简化为至少一个第二文本,同时将各所述第一文本对应的第一语言集合中的语言分别翻译成第二语言集合中的至少一个语言,并分别作为各所述第二文本对应的语言,所述第一语言集合包括多个语言,所述第一语言集合包括各所述源文本分别对应的待翻译语言,所述第二语言集合包括多个语言,所述第二语言集合包括各所述目标语言;
获取所述摘要生成模型输出的分别与各所述目标语言对应的摘要文本。


2.根据权利要求1所述的方法,其特征在于,所述获取至少一个源文本,包括:
获取至少两个源文本,各所述源文本对应的待翻译语言不同;
所述将至少一个源文本和与各所述目标语言匹配的指示信息输入到预先训练的摘要生成模型中,包括:
如果各所述源文本满足语义相似条件,则将至少两个源文本和与各所述目标语言匹配的指示信息输入到预先训练的摘要生成模型中。


3.根据权利要求1所述的方法,其特征在于,所述获取至少一个目标语言,包括:
获取至少两个目标语言,各所述目标语言不同。


4.根据权利要求1所述的方法,其特征在于,所述摘要生成模型为Seq2Seq模型,所述摘要生成模型包括编码器和解码器;其中,所述编码器和所述解码器的总数量为至少三个,不同编码器对应不同源文本,不同解码器对应不同目标语言。


5.根据权利要求4所述的方法,其特征在于,所述获取所述摘要生成模型输出的分别与各所述目标语言对应的摘要文本,包括:
通过所述摘要生成模型中的多个编码器分别提取对应的源文本中的源文本序列片段,并进行融合编码,形成所述源文本的目标特征向量;
通过所述摘要生成模型中的解码器根据所述目标特征向量和所述目标语言,将所述目标特征向量映射为目标语言的文本序列,作为摘要文本。


6.根据权利...

【专利技术属性】
技术研发人员:王明轩李磊
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1