The invention discloses a method and a device for pushing information. Including a specific embodiment of the method: obtaining historical information push; history will push the information input deep learning model, data acquisition of deep learning model of hidden layer output; encoding hidden layer output data by encoding data; clustering with the same encoding the historical data of push information, historical information push cluster; in response to the historical information push cluster history information push send number is less than a predetermined threshold, the cluster based on history information push, push information to the user. This method takes into account both the efficiency of clustering and the accuracy of clustering results, so as to improve the efficiency and pertinence of push information.
【技术实现步骤摘要】
本申请涉及计算机
,具体涉及互联网
,尤其涉及用于推送信息的方法和装置。
技术介绍
目前,搜索页面的后台服务器通常会将历史问题中的相似问题进行聚类,之后根据聚类结果提取出最时新和最优质的问题和答案,在用户搜索问题的答案时进行优先展示,也即向用户推送最时新和最优质的问题和答案。在将历史问题中的相似问题进行聚类时,可以将问题的文本转化为词向量或特征向量,之后根据词向量或特征向量的相似度聚类文本;或者利用自然语言处理技术或机器学习技术获取文本的高级语义特征,之后根据高级语义特征的相似度聚类文本。然而,目前的根据聚类结果向用户推送信息的方法,若采用根据词向量或特征向量聚类的方法,则存在语义缺失的问题,聚类结果的召回率低;若采用根据高级语义特征聚类的方法,由于高级语义特征通常为高维数组或浮点数数组,则相似度计算的效率较低。因此,目前的向用户推送信息的方法存在语义缺失或计算效率较低的问题。
技术实现思路
本申请的目的在于提出一种改进的用于推送信息的方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种用于推送信息的方法,所述方法包括:获取历史推送信息;将所述历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;编码所述隐层输出数据,得到编码数据;聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;响应于所述历史推送信息簇中历史推送信息的数量小于预定阈值,基于所述历史推送信息簇,向用户推送信息。在一些实施例中,所述编码所述隐层输出数据,得到编码数据包括:一次编码所述隐层输出数据,得到初步编码数据;二次编码所述初步编码数据,得到 ...
【技术保护点】
一种用于推送信息的方法,其特征在于,所述方法包括:获取历史推送信息;将所述历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;编码所述隐层输出数据,得到编码数据;聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;响应于所述历史推送信息簇中历史推送信息的数量小于预定阈值,基于所述历史推送信息簇,向用户推送信息。
【技术特征摘要】
1.一种用于推送信息的方法,其特征在于,所述方法包括:获取历史推送信息;将所述历史推送信息输入深度学习模型,获取深度学习模型的隐层输出数据;编码所述隐层输出数据,得到编码数据;聚类具有相同编码数据的历史推送信息,得到历史推送信息簇;响应于所述历史推送信息簇中历史推送信息的数量小于预定阈值,基于所述历史推送信息簇,向用户推送信息。2.根据权利要求1所述的方法,其特征在于,所述编码所述隐层输出数据,得到编码数据包括:一次编码所述隐层输出数据,得到初步编码数据;二次编码所述初步编码数据,得到二次编码数据;以及所述聚类具有相同编码数据的历史推送信息,得到历史推送信息簇包括:聚类具有相同二次编码数据的历史推送信息,得到历史推送信息簇。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应于所述历史推送信息簇中历史推送信息的数量大于或等于预定阈值,根据预设规则调整所述二次编码的编码参数以提高压缩率,并执行所述二次编码所述初步编码数据,得到二次编码数据步骤。4.根据权利要求3所述的方法,其特征在于,所述一次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据;和/或所述二次编码包括以下一项或多项:降维;将浮点数向量格式的输入数据映射到1和0,得到布尔向量格式的输出数据;卷积输入数据,并池化卷积后的输入数据,得到池化卷积后的输出数据;以及采样或截取输入数据,得到采样或截取后的输出数据。5.根据权利要求4所述的方法,其特征在于,所述根据预设规则调整所述二次编码的编码参数以提高压缩率包括:根据预设规则增加所述采样的采样点以提高压缩率。6.根据权利要求1-5任意一项所述的方法,其特征在于,所述基于历史推送信息簇,向用户推送信息包括以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长的历史推送信息;向用户推送所述历史推送信息簇中评分高于预定分值的历史推送信息;删除预设时间之前的历史推送信息;以及删除评分低于预设阈值的历史推送信息。7.根据权利要求1-5任意一项所述的方法,其特征在于,所述基于历史推送信息簇,向用户推送信息包括以下一项或多项:向用户推送所述历史推送信息簇中距离当前时间的时长小于预定时长且评分高于预定分值的历史推送信息;删除预设时间之前且评分低于预设阈值的历史推送信息。8.一种用于推送信息的装置,其特征在于,所述装置包括:信息获...
【专利技术属性】
技术研发人员:王文斌,施鹏,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。