摘要生成方法和装置制造方法及图纸

技术编号:20866331 阅读:36 留言:0更新日期:2019-04-17 09:19
本申请实施例公开了摘要生成方法和装置。该方法的一具体实施方式包括:确定目标文本的文本特征;根据所述文本特征确定所述目标文本所属的目标文本类别;将所述目标文本输入到预先训练的、与所述目标文本类别对应的摘要提取模型,得到所述目标文本的摘要,其中所述摘要提取模型用于确定所输入的文本的摘要。该实施方式一方面可以降低各摘要提取模型的复杂度,从而减少训练摘要提取模型所用的标注数据,以降低训练成本。另一方面还可以提高所提取的文本的摘要的准确度。

【技术实现步骤摘要】
摘要生成方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及摘要生成方法和装置。
技术介绍
随着自媒体时代的到来,互联网中每天所更新的信息的数量呈爆炸式增长。目前用户可以通过移动终端例如手机查看互联网上提供的各种信息。由于每天互联网上更新的信息量非常庞大,类别多样,形式变化多端,用户需要花很多的时间从信息流中获取各信息的中心内容。通常文本摘要可以以简明扼要且语义连贯的语言,确切地描述原始文本的中心内容。可以在信息流中向用户提供各信息的摘要,使得用户可以通过浏览信息流中各信息的摘要来了解各信息的中心内容。通过这样的方式,来节省人们的阅读时间。
技术实现思路
本申请实施例提出了一种摘要生成方法和装置。第一方面,本申请实施例提供了一种摘要生成方法,该方法包括:确定目标文本的文本特征;根据文本特征确定目标文本所属的目标文本类别;将目标文本输入到预先训练的、与目标文本类别对应的摘要提取模型,得到目标文本的摘要,其中摘要提取模型用于确定所输入的文本的摘要。在一些实施例中,确定目标文本的文本特征,包括:将目标文本的标题输入到预先训练的文本向量模型,确定目标文本对应的第一特征向量本文档来自技高网...

【技术保护点】
1.一种摘要生成方法,包括:确定目标文本的文本特征;根据所述文本特征确定所述目标文本所属的目标文本类别;将所述目标文本输入到预先训练的、与所述目标文本类别对应的摘要提取模型,得到所述目标文本的摘要,其中所述摘要提取模型用于确定所输入的文本的摘要。

【技术特征摘要】
1.一种摘要生成方法,包括:确定目标文本的文本特征;根据所述文本特征确定所述目标文本所属的目标文本类别;将所述目标文本输入到预先训练的、与所述目标文本类别对应的摘要提取模型,得到所述目标文本的摘要,其中所述摘要提取模型用于确定所输入的文本的摘要。2.根据权利要求1所述的方法,其中,所述确定目标文本的文本特征,包括:将所述目标文本的标题输入到预先训练的文本向量模型,确定所述目标文本对应的第一特征向量;以及所述基于所述文本特征确定所述目标文本对应的目标文本类别,包括:将所述第一特征向量输入到预先训练的文本分类模型,确定所述目标文本所属的目标文本类别;其中:所述文本向量模型用于根据输入的目标文本的标题,确定目标文本的第一特征向量,以及所述文本分类模型用于根据输入的目标文本的特征向量从多个预设文本类别中确定目标文本所属的目标文本类别。3.根据权利要求1所述的方法,其中,所述确定目标文本的文本特征,包括:根据预设文本特征提取规则从所述目标文本的正文内容中提取目标文本的第二特征向量;以及所述基于所述文本特征确定所述目标文本所属的目标文本类别,包括:将所述第二特征向量输入到预先训练的文本分类模型,确定所述目标文本对应的目标文本类别;其中:所述文本分类模型用于根据输入的目标文本的特征向量从多个预设文本类别中确定目标文本所属的目标文本类别。4.根据权利要求2所述的方法,其中,所述确定目标文本的文本特征,包括:根据预设文本特征提取规则从所述目标文本的正文内容中提取目标文本的第二特征向量;以及所述将所述第一特征向量输入到预先训练的文本分类模型,确定所述目标文本所属的目标文本类别,包括:将所述第一特征向量和所述第二特征向量输入到预先训练的文本分类模型,确定所述目标文本对应的目标文本类别。5.根据权利要求3或4所述的方法,其中,所述根据预先确定的特征向量提取规则提取所述目标文本的正文内容对应的第二特征向量,包括:根据预设正则表达式和预设结构特征提取规则提取所述目标文本的正文内容对应的第二特征向量。6.根据权利要求2所述的方法,其中,所述文本向量模型为卷积神经网络模型。7.根据权利要求2-4之一所述的方法,其中,所述文本分类模型为前馈神经网络模型。8.一种摘要生成装置,包括:第一确定单元,被配置成确定目标文本的文本特征;第二确定单元,被配置成根据所...

【专利技术属性】
技术研发人员:徐伟刘家辰肖欣延吕雅娟佘俏俏
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1