用于推送信息的方法和装置制造方法及图纸

技术编号:14182760 阅读:55 留言:0更新日期:2016-12-14 12:09
本申请公开了用于推送信息的方法和装置。所述方法的一具体实施方式包括:获取历史推送信息;将历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;编码隐层输出数据,得到编码数据;聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;响应于历史推送信息簇中历史推送信息的数量小于预定阈值,基于历史推送信息簇,向用户推送信息。该实施方式兼顾了聚类的效率和聚类结果的精度,从而提高了推送信息的效率和针对性。

Method and apparatus for pushing information

The invention discloses a method and a device for pushing information. Including a specific embodiment of the method: obtaining historical information push; history will push the information input deep learning model, data acquisition of deep learning model of hidden layer output; encoding hidden layer output data by encoding data; clustering with the same encoding the historical data of push information, historical information push cluster; in response to the historical information push cluster history information push send number is less than a predetermined threshold, the cluster based on history information push, push information to the user. This method takes into account both the efficiency of clustering and the accuracy of clustering results, so as to improve the efficiency and pertinence of push information.

【技术实现步骤摘要】

本申请涉及计算机
,具体涉及互联网
,尤其涉及用于推送信息的方法和装置
技术介绍
目前,搜索页面的后台服务器通常会将历史问题中的相似问题进行聚类,之后根据聚类结果提取出最时新和最优质的问题和答案,在用户搜索问题的答案时进行优先展示,也即向用户推送最时新和最优质的问题和答案。在将历史问题中的相似问题进行聚类时,可以将问题的文本转化为词向量或特征向量,之后根据词向量或特征向量的相似度聚类文本;或者利用自然语言处理技术或机器学习技术获取文本的高级语义特征,之后根据高级语义特征的相似度聚类文本。然而,目前的根据聚类结果向用户推送信息的方法,若采用根据词向量或特征向量聚类的方法,则存在语义缺失的问题,聚类结果的召回率低;若采用根据高级语义特征聚类的方法,由于高级语义特征通常为高维数组或浮点数数组,则相似度计算的效率较低。因此,目前的向用户推送信息的方法存在语义缺失或计算效率较低的问题。
技术实现思路
本申请的目的在于提出一种改进的用于推送信息的方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种用于推送信息的方法,所述方法包括:获取历史推送信息;将所述历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;编码所述隐层输出数据,得到编码数据;聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;响应于所述历史推送信息簇中历史推送信息的数量小于预定阈值,基于所述历史推送信息簇,向用户推送信息。在一些实施例中,所述编码所述隐层输出数据,得到编码数据包括:一次编码所述隐层输出数据,得到初步编码数据;二次编码所述初步编码数据,得到二次编码数据;以及所述聚类具有相同编码数据的历史推送信息,得到历史推送信息簇包括:聚类具有相同二次编码数据的历史推送信息,得到历史推送信息簇。在一些实施例中,所述方法还包括:响应于所述历史推送信息簇中历史推送信息的数量大于或等于预定阈值,根据预设规则调整所述二次编码的编码参数以提高压缩率,并执行所述二次编码所述初步编码数据,得到二次编码数据步骤。在一些实施例中,所述一次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据;和/或所述二次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据。在一些实施例中,所述根据预设规则调整所述二次编码的编码参数以提高压缩率包括:根据预设规则增加所述采样的采样点以提高压缩率。在一些实施例中,所述基于历史推送信息簇,向用户推送信息包括以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长的历史推送信息;向用户推送所述历史推送信息簇中评分高于预定分值的历史推送信息;删除预设时间之前的历史推送信息;以及删除评分低于预设阈值的历史推送信息。在一些实施例中,所述基于历史推送信息簇,向用户推送信息包括以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长且评分高于预定分值的历史推送信息;删除预设时间之前且评分低于预设阈值的历史推送信息。第二方面,本申请提供了一种用于推送信息的装置,所述装置包括:信息获取单元,用于获取历史推送信息;数据获取单元,用于将所述历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;数据编码单元,用于编码所述隐层输出数据,得到编码数据;信息聚类单元,聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;信息推送单元,用于响应于所述历史推送信息簇中历史推送信息的数量小于预定阈值,基于所述历史推送信息簇,向用户推送信息。在一些实施例中,所述数据编码单元包括:初步编码子单元,用于一次编码所述隐层输出数据,得到初步编码数据;二次编码子单元,用于二次编码所述初步编码数据,得到二次编码数据;以及所述信息聚类单元包括:信息聚类子单元,用于聚类具有相同二次编码数据的历史推送信息,得到历史推送信息簇。在一些实施例中,所述装置还包括:参数调整单元,用于响应于所述历史推送信息簇中历史推送信息的数量大于或等于预定阈值,根据预设规则调整所述二次编码子单元用于二次编码的编码参数以提高压缩率,并调用所述二次编码子单元以二次编码所述初步编码数据,得到二次编码数据。在一些实施例中,所述初步编码子单元中的一次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据;和/或所述二次编码子单元中的二次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据。在一些实施例中,所述参数调整单元进一步用于:根据预设规则增加所述采样的采样点以提高压缩率。在一些实施例中,所述信息推送单元进一步用于以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长的历史推送信息;向用户推送所述历史推送信息簇中评分高于预定分值的历史推送信息;删除预设时间之前的历史推送信息;以及删除评分低于预设阈值的历史推送信息。在一些实施例中,所述信息推送单元进一步用于以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长且评分高于预定分值的历史推送信息;删除预设时间之前且评分低于预设阈值的历史推送信息。本申请提供的用于推送信息的方法和装置,通过获取历史推送信息,而后将历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据,之后编码隐层输出数据,得到编码数据,之后聚类具有相同编码数据的历史推送信息,得到历史推送信息簇,最后响应于历史推送信息簇中历史推送信息的数量小于预定阈值,基于历史推送信息簇,向用户推送信息,兼顾了聚类的效率和聚类结果的精度,从而提高了推送信息的效率和针对性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于推送信息的方法的一个实施例的示意性流程图;图3是根据本申请的用于推送信息的方法的又一个实施例的示意性流程图;图4是根据本申请的用于推送信息的方法的第三个实施例的示意性流程图;图5是根据本申请的用于推送信息的装置的一个实施例的示例性结构图;图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参本文档来自技高网...
用于推送信息的方法和装置

【技术保护点】
一种用于推送信息的方法,其特征在于,所述方法包括:获取历史推送信息;将所述历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;编码所述隐层输出数据,得到编码数据;聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;响应于所述历史推送信息簇中历史推送信息的数量小于预定阈值,基于所述历史推送信息簇,向用户推送信息。

【技术特征摘要】
1.一种用于推送信息的方法,其特征在于,所述方法包括:获取历史推送信息;将所述历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;编码所述隐层输出数据,得到编码数据;聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;响应于所述历史推送信息簇中历史推送信息的数量小于预定阈值,基于所述历史推送信息簇,向用户推送信息。2.根据权利要求1所述的方法,其特征在于,所述编码所述隐层输出数据,得到编码数据包括:一次编码所述隐层输出数据,得到初步编码数据;二次编码所述初步编码数据,得到二次编码数据;以及所述聚类具有相同编码数据的历史推送信息,得到历史推送信息簇包括:聚类具有相同二次编码数据的历史推送信息,得到历史推送信息簇。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应于所述历史推送信息簇中历史推送信息的数量大于或等于预定阈值,根据预设规则调整所述二次编码的编码参数以提高压缩率,并执行所述二次编码所述初步编码数据,得到二次编码数据步骤。4.根据权利要求3所述的方法,其特征在于,所述一次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据;和/或所述二次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据。5.根据权利要求4所述的方法,其特征在于,所述根据预设规则调整所述二次编码的编码参数以提高压缩率包括:根据预设规则增加所述采样的采样点以提高压缩率。6.根据权利要求1-5任意一项所述的方法,其特征在于,所述基于历史推送信息簇,向用户推送信息包括以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长的历史推送信息;向用户推送所述历史推送信息簇中评分高于预定分值的历史推送信息;删除预设时间之前的历史推送信息;以及删除评分低于预设阈值的历史推送信息。7.根据权利要求1-5任意一项所述的方法,其特征在于,所述基于历史推送信息簇,向用户推送信息包括以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长且评分高于预定分值的历史推送信息;删除预设时间之前且评分低于预设阈值的历史推送信息。8.一种用于推送信息的装置,其特征在于,所述装置包括:信息获...

【专利技术属性】
技术研发人员:王文斌施鹏
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1