一种信息的处理方法、装置及设备制造方法及图纸

技术编号:22166917 阅读:17 留言:0更新日期:2019-09-21 10:35
本说明书实施例公开了一种信息的处理方法、装置及设备,所述方法包括:从预定的语料数据库中获取与预定的关键词相对应的语料数据;基于所述关键词对应的类别标签和预定的分类模型,对所述语料数据进行分类,确定所述语料数据所属的类别标签,所述分类模型为基于神经网络对文本进行分类的模型,所述类别标签是待发放资源的用户所具备的属性标签;对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,以基于所述目标短语生成待发放的资源的第一展示文案。

An Information Processing Method, Device and Equipment

【技术实现步骤摘要】
一种信息的处理方法、装置及设备
本说明书涉及计算机
,尤其涉及一种信息的处理方法、装置及设备。
技术介绍
为了吸引更多的用户关注,商户会进行很多的营销活动,例如发放或抽取奖品等,为了达到较好的营销效果,通常可以为奖品设置相应的展示文案,例如,用户抽取的奖品为某店铺的满减优惠券,则将该满减优惠券的相关信息发送给该用户的同时,还可以向该用户发送该奖品的展示文案,如“献给奋斗的你”等。通常,在营销活动中,为奖品设置文案可以通过人工的方式实现,即针对某奖品,商户会通过人工撰写的方式撰写一个或多个展示文案,当某用户抽取到该奖品时,在将该奖品的相关信息发送给该用户的同时,还将上述展示文案发送给该用户。然而,通过上述人工的方式为奖品设置展示文案的处理,由于所有奖品的展示文案都需要商户或运营人员通过人工完成,人力资源消耗较大,展示文案的生成效率较低,且最终得到的展示文案的效果可能较差,因此,需要提供一种展示文案的生成效率更高、更适合用户的处理方案。
技术实现思路
本说明书实施例的目的是提供一种信息的处理方法、装置及设备,以提供一种展示文案的生成效率更高、更适合用户的处理方案。为了实现上述技术方案,本说明书实施例是这样实现的:本说明书实施例提供的一种信息的处理方法,所述方法包括:从预定的语料数据库中获取与预定的关键词相对应的语料数据;基于所述关键词对应的类别标签和预定的分类模型,对所述语料数据进行分类,确定所述语料数据所属的类别标签,所述分类模型为基于神经网络对文本进行分类的模型,所述类别标签是待发放资源的用户所具备的属性标签;对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,以基于所述目标短语生成待发放的资源的第一展示文案。可选地,所述方法还包括:接收目标用户的资源获取请求;确定发放给所述目标用户的资源的信息;从所述目标用户对应的类别标签中,获取与资源的信息匹配的第一类别标签;根据所述第一类别标签,从所述目标短语中获取所述第一类别标签对应的目标短语;基于获取的目标短语,生成发送给所述目标用户的资源的第一展示文案。可选地,所述方法还包括:从预定的语料数据库中获取与预定的资源关键词相对应的资源语料数据;基于所述预定的资源关键词和资源语料数据,生成待发放的资源的第二展示文案。可选地,所述基于所述预定的资源关键词和资源语料数据,生成待发放的资源的第二展示文案,包括:将所述预定的资源关键词和所述资源语料数据输入到预定的Pointer-Generator模型中,得到待发放的资源的第二展示文案。可选地,所述方法还包括:从预定的语料数据库中获取与预定的关键词相对应的样本数据;基于所述关键词对应的类别标签和获取的样本数据,对所述分类模型进行训练,得到训练后的分类模型。可选地,所述方法还包括:对所述样本数据进行RandomMask操作,以随机对所述样本数据进行关键词的替换。可选地,所述方法还包括:调整每个类别标签对应的样本数据的数量,以使每个类别标签对应的样本数据的数量在预定的数量阈值范围内。可选地,所述对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,包括:基于预定的正则表达式,对不同类别标签的所述语料数据进行短语抽取处理,得到抽取结果;对所述抽取结果进行过滤处理,得到不同类别标签对应的目标短语。可选地,所述对所述抽取结果进行过滤处理,得到不同类别标签对应的目标短语,包括:对所述抽取结果进行文本长度过滤处理、IDF分过滤处理、NER过滤处理中的一项或多项,得到不同类别标签对应的目标短语。本说明书实施例提供的一种信息的处理装置,所述装置包括:语料获取模块,用于从预定的语料数据库中获取与预定的关键词相对应的语料数据;分类模块,用于基于所述关键词对应的类别标签和预定的分类模型,对所述语料数据进行分类,确定所述语料数据所属的类别标签,所述分类模型为基于神经网络对文本进行分类的模型,所述类别标签是待发放资源的用户所具备的属性标签;抽取模块,用于对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,以基于所述目标短语生成待发放的资源的第一展示文案。可选地,所述装置还包括:资源语料获取模块,用于从预定的语料数据库中获取与预定的资源关键词相对应的资源语料数据;文案生成模块,用于基于所述预定的资源关键词和资源语料数据,生成待发放的资源的第二展示文案。可选地,所述文案生成模块,用于将所述预定的资源关键词和所述资源语料数据输入到预定的Pointer-Generator模型中,得到待发放的资源的第二展示文案。可选地,所述抽取模块,包括:抽取单元,用于基于预定的正则表达式,对不同类别标签的所述语料数据进行短语抽取处理,得到抽取结果;过滤单元,用于对所述抽取结果进行过滤处理,得到不同类别标签对应的目标短语。可选地,所述过滤单元,用于对所述抽取结果进行文本长度过滤处理、IDF分过滤处理、NER过滤处理中的一项或多项,得到不同类别标签对应的目标短语。本说明书实施例提供的一种信息的处理设备,所述信息的处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:从预定的语料数据库中获取与预定的关键词相对应的语料数据;基于所述关键词对应的类别标签和预定的分类模型,对所述语料数据进行分类,确定所述语料数据所属的类别标签,所述分类模型为基于神经网络对文本进行分类的模型,所述类别标签是待发放资源的用户所具备的属性标签;对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,以基于所述目标短语生成待发放的资源的第一展示文案。由以上本说明书实施例提供的技术方案可见,本说明书实施例通过从预定的语料数据库中获取与预定的关键词相对应的语料数据,然后,基于该关键词对应的类别标签和预定的分类模型,对该语料数据进行分类,确定该语料数据所属的类别标签,该分类模型为基于神经网络对文本进行分类的模型,该类别标签是待发放资源的用户所具备的属性标签,进而,对不同类别标签的语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,以基于目标短语生成待发放的资源的第一展示文案,这样,通过用户的类别标签对应的关键词,获取相应的语料数据,再通过分类模型将该语料数据映射到相应的类别标签,进而得到每个类别标签对应的短语,该短语可以作为后续资源发放的展示文案,使得展示文案更加适合该用户,而且,不需要人工参与展示文案的生成,从而,减少了人力资源的消耗,提高了展示文案的生成效率。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本说明书一种信息的处理方法实施例;图2为本说明书一种奖品的展示文案的示意图;图3为本说明书另一种信息的处理方法实施例;图4为本说明书一种Text-CNN模型的处理原理示意图;图5为本说明书一种信息的处理装置实施例;图6为本说明书一种信息的处理设备实施例。具体实施方式本说明书实施例提供一种信息的处理方法、装置及设备本文档来自技高网...

【技术保护点】
1.一种信息的处理方法,所述方法包括:从预定的语料数据库中获取与预定的关键词相对应的语料数据;基于所述关键词对应的类别标签和预定的分类模型,对所述语料数据进行分类,确定所述语料数据所属的类别标签,所述分类模型为基于神经网络对文本进行分类的模型,所述类别标签是待发放资源的用户所具备的属性标签;对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,以基于所述目标短语生成待发放的资源的第一展示文案。

【技术特征摘要】
1.一种信息的处理方法,所述方法包括:从预定的语料数据库中获取与预定的关键词相对应的语料数据;基于所述关键词对应的类别标签和预定的分类模型,对所述语料数据进行分类,确定所述语料数据所属的类别标签,所述分类模型为基于神经网络对文本进行分类的模型,所述类别标签是待发放资源的用户所具备的属性标签;对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,以基于所述目标短语生成待发放的资源的第一展示文案。2.根据权利要求1所述的方法,所述方法还包括:接收目标用户的资源获取请求;确定发放给所述目标用户的资源的信息;从所述目标用户对应的类别标签中,获取与所述资源的信息匹配的第一类别标签;根据所述第一类别标签,从所述目标短语中获取所述第一类别标签对应的目标短语;基于获取的目标短语,生成发送给所述目标用户的资源的第一展示文案。3.根据权利要求1所述的方法,所述方法还包括:从预定的语料数据库中获取与预定的资源关键词相对应的资源语料数据;基于所述预定的资源关键词和资源语料数据,生成待发放的资源的第二展示文案。4.根据权利要求3所述的方法,所述基于所述预定的资源关键词和资源语料数据,生成待发放的资源的第二展示文案,包括:将所述预定的资源关键词和所述资源语料数据输入到预定的Pointer-Generator模型中,得到待发放的资源的第二展示文案。5.根据权利要求1所述的方法,所述方法还包括:从预定的语料数据库中获取与预定的关键词相对应的样本数据;基于所述关键词对应的类别标签和获取的样本数据,对所述分类模型进行训练,得到训练后的分类模型。6.根据权利要求1所述的方法,所述方法还包括:对所述样本数据进行RandomMask操作,以随机对所述样本数据进行关键词的替换。7.根据权利要求6所述的方法,所述方法还包括:调整每个类别标签对应的样本数据的数量,以使每个类别标签对应的样本数据的数量在预定的数量阈值范围内。8.根据权利要求1所述的方法,所述对不同类别标签的所述语料数据进行短语抽取处理,得到不同类别标签对应的目标短语,包括:基于预定的正则表达式,对不同类别标签的所述语料数据进行短语抽取处理,得到抽取结果;对所述抽取结果进行过滤处理,得到不同类别标签对应的目标短语。9.根据权利要求8所述的方法,所述...

【专利技术属性】
技术研发人员:江少华钟文亮符劼
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1