用于生成文本标题的方法和装置制造方法及图纸

技术编号:20273092 阅读:29 留言:0更新日期:2019-02-02 03:52
本申请实施例公开了用于生成文本标题的方法和装置。该方法的一具体实施方式包括:获取待处理文本;提取待处理文本的特征信息;将待处理文本的特征信息输入预先训练的标题生成模型,得到待处理文本的文本标题,其中,标题生成模型用于表征文本和文本标题的对应关系。该实施方式实现了提高生成待处理文本的文本标题的效率。

【技术实现步骤摘要】
用于生成文本标题的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成文本标题的方法和装置。
技术介绍
随着互联网的不断发展,网上的各类文本也越来越多。在许多场景下,需要确定这些文本的标题。目前,文本的标题一般采用人工方式确定。
技术实现思路
本申请实施例提出了用于生成文本标题的方法和装置。第一方面,本申请实施例提供了一种用于生成文本标题的方法,包括:获取待处理文本;提取待处理文本的特征信息;将待处理文本的特征信息输入预先训练的标题生成模型,得到待处理文本的文本标题,其中,标题生成模型用于表征文本和文本标题的对应关系。在一些实施例中,标题生成模型通过以下步骤训练得到:获取训练样本集合,训练样本包括文本和文本的文本标题;将训练样本集合中的训练样本的文本作为输入,将与输入的文本对应的文本标题作为期望输出,利用机器学习方法训练得到标题生成模型。在一些实施例中,提取待处理文本的特征信息,包括:获取特征位置信息;基于特征位置信息,将待处理文本中的、特征位置信息所指示的位置的文本确定为待处理文本的特征信息。在一些实施例中,提取待处理文本的特征信息,包括:将待处理文本输入预先训练的文本特征提取模型,得到待处理文本的特征信息,其中,文本特征提取模型用于表征文本与文本的特征信息的对应关系。在一些实施例中,该方法还包括:基于待处理文本和待处理文本的文本标题,生成推送信息。在一些实施例中,待处理文本包括至少一个文本,其中,至少一个文本通过以下步骤得到:获取目标文本集合,目标文本集合中的文本为符合预设条件的文本;对于目标文本集合中的文本,获取该文本的预设属性的属性值;根据预设属性的属性值从大到小的顺序,从目标文本集合中选取预设数目个文本,并将所选取的文本确定为至少一个文本。第二方面,本申请实施例提供了一种用于生成文本标题的装置,包括:获取单元,被配置成获取待处理文本;提取单元,被配置成提取待处理文本的特征信息;标题生成单元,被配置成将待处理文本的特征信息输入预先训练的标题生成模型,得到待处理文本的文本标题,其中,标题生成模型用于表征文本和文本标题的对应关系。在一些实施例中,标题生成模型通过以下步骤训练得到:获取训练样本集合,训练样本包括文本和文本的文本标题;将训练样本集合中的训练样本的文本作为输入,将与输入的文本对应的文本标题作为期望输出,利用机器学习方法训练得到标题生成模型。在一些实施例中,提取单元进一步被配置成:获取特征位置信息;基于特征位置信息,将待处理文本中的、特征位置信息所指示的位置的文本确定为待处理文本的特征信息。在一些实施例中,提取单元进一步被配置成:将待处理文本输入预先训练的文本特征提取模型,得到待处理文本的特征信息,其中,文本特征提取模型用于表征文本与文本的特征信息的对应关系。在一些实施例中,装置还包括:生成单元,被配置成基于待处理文本和待处理文本的文本标题,生成推送信息。在一些实施例中,待处理文本包括至少一个文本,其中,至少一个文本通过以下步骤得到:获取目标文本集合,目标文本集合中的文本为符合预设条件的文本;对于目标文本集合中的文本,获取该文本的预设属性的属性值;根据预设属性的属性值从大到小的顺序,从目标文本集合中选取预设数目个文本,并将所选取的文本确定为至少一个文本。第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,上述程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的方法和装置,首先获取待处理文本。之后,提取待处理文本的特征信息。然后,将待处理文本的特征信息输入预先训练的标题生成模型,得到待处理文本的文本标题。在此过程中,由于使用了标题生成模型,实现了待处理文本的文本标题的自动生成。与人工方式相比,提高了生成待处理文本的文本标题的效率。此外,避免了人的主观性对于文本标题的影响。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于生成文本标题的方法的一个实施例的流程图;图3是根据本申请实施例的用于生成文本标题的方法的一个应用场景的示意图;图4是根据本申请的用于生成文本标题的方法的又一个实施例的流程图;图5是根据本申请的用于生成文本标题的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请实施例的用于生成文本标题的方法或用于生成文本标题的装置的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用,例如新闻类应用、小说类应用等等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持显示信息的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上传的待处理文本进行处理的后台处理服务器。后台处理服务器可以对接收到的待处理文本进行提取特征信息以及将特征信息输入预先训练的标题生成模型,从而得到待处理文本的文本标题,并根据需要将处理结果(例如生成的评论信息)反馈至终端设备。需要说明的是,本申请实施例所提供的用于生成文本标题的方法一般由服务器105执行,相应地,用于生成文本标题的装置一般设置于服务器105中。需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。继续参考本文档来自技高网...

【技术保护点】
1.一种用于生成文本标题的方法,包括:获取待处理文本;提取所述待处理文本的特征信息;将所述待处理文本的特征信息输入预先训练的标题生成模型,得到所述待处理文本的文本标题,其中,所述标题生成模型用于表征文本和文本标题的对应关系。

【技术特征摘要】
1.一种用于生成文本标题的方法,包括:获取待处理文本;提取所述待处理文本的特征信息;将所述待处理文本的特征信息输入预先训练的标题生成模型,得到所述待处理文本的文本标题,其中,所述标题生成模型用于表征文本和文本标题的对应关系。2.根据权利要求1所述的方法,其中,所述标题生成模型通过以下步骤训练得到:获取训练样本集合,训练样本包括文本和文本的文本标题;将所述训练样本集合中的训练样本的文本作为输入,将与输入的文本对应的文本标题作为期望输出,利用机器学习方法训练得到标题生成模型。3.根据权利要求1所述的方法,其中,所述提取所述待处理文本的特征信息,包括:获取特征位置信息;基于所述特征位置信息,将所述待处理文本中的、所述特征位置信息所指示的位置的文本确定为所述待处理文本的特征信息。4.根据权利要求1所述的方法,其中,所述提取所述待处理文本的特征信息,包括:将所述待处理文本输入预先训练的文本特征提取模型,得到所述待处理文本的特征信息,其中,所述文本特征提取模型用于表征文本与文本的特征信息的对应关系。5.根据权利要求1-4中任一所述的方法,其中,所述方法还包括:基于所述待处理文本和所述待处理文本的文本标题,生成推送信息。6.根据权利要求5所述的方法,其中,所述待处理文本包括至少一个文本,其中,所述至少一个文本通过以下步骤得到:获取目标文本集合,所述目标文本集合中的文本为符合预设条件的文本;对于所述目标文本集合中的文本,获取该文本的预设属性的属性值;根据预设属性的属性值从大到小的顺序,从所述目标文本集合中选取预设数目个文本,并将所选取的文本确定为所述至少一个文本。7.一种用于生成文本标题的装置,包括:获取单元,被配置成获取待处理文本;提取单元,被配置成提取所述待处理文本的特征信息;标题生成单元,被配置成将所述待处理文本的特征信息输入预先训练的...

【专利技术属性】
技术研发人员:李磊陈家泽马维英华立锋
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1