一种确定推送信息的方法及装置制造方法及图纸

技术编号:16286916 阅读:23 留言:0更新日期:2017-09-25 10:02
本申请公开了一种确定推送信息的方法及装置,所述推送信息为描述推送对象的数据信息,该方法包括:当检测到用户浏览网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;获取所述至少一个对象聚类对应的目标关键词,根据所述目标关键词从信息推送系统中获取推送信息。本申请公开的方法和装置可以提高推送的信息与用户的潜在需求的一致性,提高了信息推送的精确度。

Method and device for determining push information

The invention discloses a determining method and device of pushing information, the push of information push object data for the description of the method includes: to detect when users browse the web content, according to the pre stored user information and / or web content information to determine the reference to push as determined at least one; a clustering of the reference object push objects corresponding to the clustering of the object and behavior is the use of the value of the object to send push text relevance correlation value of multiple push objects clustering algorithm to obtain the target keywords; at least one object cluster corresponding to the acquisition, according to the acquired information push the target keywords from the information push system. The method and device disclosed herein can increase the consistency between the push information and the potential requirements of the user, and improve the accuracy of the information push.

【技术实现步骤摘要】

本申请涉及电子信息
,尤其涉及一种确定推送信息的方法及装置
技术介绍
目前网络系统会根据用户的网络行为主动获取一些数据推荐给用户,例如:用户在使用搜索引擎进行搜索时,除了搜索引擎会根据用户输入的关键词在搜索引擎服务器中查询获取到相应搜索结果并反馈给用户外,搜索引擎还会根据接收到的搜索关键词,从信息推送系统或其他系统中获取与所述搜索关键词对应的查询结果,并将所述查询结果作为推荐数据主动推送给用户。但是因为现有的信息推送系统中包括大量的数据,所以导致想要搜索到与用户搜索关键词密切相关的推荐数据具有很大的难度,在现有技术的方案中,如果要获得正确的推荐数据则主要的问题在于如何获取准确的关键词。现有技术中,对应不同的应用场景,获取推荐数据的关键词的具体方法包括以下几种方式:a,在搜索查询场景:直接使用用户输入的查询关键词(querywords)作为获取推荐数据的关键词;b,在上下文场景:当用户浏览具体介绍某个推送对象的网页内容/资讯内容/博客文章时,提取对应当前浏览对象(即所述推送对象)预存的相关关键词作为获取推荐数据的关键词;如果没有,也可以将当前浏览对象的标题进行分词处理得到相应的关键词;c,在其他场景(也可以称之为一般性场景):当用户刚刚进入网站首页等此类场景中时,用户既没有输入关键词、也没有当前浏览对象时,会使用用户以往的查询关键词作为输入关键词来获取推荐数据。在现有技术方案中,对于所述上下文场景来说,基于当前浏览对象得到的关键词,往往过于细化,很可能查询不到足够的推荐数据;如果用户想要获取到想要的推荐数据则需要多次查询信息推送系统,从而造成用户的重复操作,并导致系统的无意义访问量增加,进一步导致系统资源的浪费。对于一般性场景,在进行搜索时,是使用用户以往的查询关键词,因为用户对商品的需求会随时间有所变化,所以该种方式并不一定能准确的反应用户的真实需求。比如,部分用户可能并没有查询关键词;部分用户虽然有查询关键词,这些关键词能从信息推送系统中获取足够多的推荐数据,但是因为用户需求发生变化所以导致信息推送系统推送给用户的大部分数据是无意义的,所以导致信息推送系统向用户发送无意义数据时浪费了大量的系统资源。通过上述三种商品信息的获取方案获取到的推荐数据并不能完全的符合用户当时的需求,在这种情况下会浪费大量的网络资源发送无意义的推荐数据的同时并不能有效推送用户确切需要的推荐数据。
技术实现思路
本申请提供一种确定推送信息的方法及装置,本申请所提供的方法和装置用于解决现有技术中获取到的推荐数据并不能完全的符合用户当时的需求,在这种情况下会浪费大量的网络资源发送无意义的推荐数据的同时并不能有效推送用户确切需要的推荐数据的问题。针对上述问题本申请提供一种确定推送信息的方法,所述推送信息为描述推送对象的数据信息,该方法包括:当检测到用户浏览任一网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中每个推送对象对应的关键词组得到该对象聚类的关键词组;获取所述至少一个对象聚类对应的目标关键词组,根据所述目标关键词组从信息推送系统中获取推送信息。根据上述方法本申请还提供一种确定推送信息的装置,所述推送信息为描述推送对象的数据信息,该装置包括:基准推送对象确定模块,当检测到用户浏览任一网页内容时,用于根据预存的用户信息和/或网页内容信息确定基准推送对象;对象聚类确定模块,用于确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中每个推送对象对应的关键词组得到该对象聚类的关键词组;推送信息确定模块,用于获取所述至少一个对象聚类对应的目标关键词组,根据所述目标关键词组从信息推送系统中获取推送信息。上述技术方案中的一个或两个,至少具有如下技术效果:本申请实施例所提供的方法和装置能够基于内容相关与行为相关,对推送对象进行分类,使得每个推送对象都归在某个聚类中,然后对于聚类提取关键词,可以提高推送的信息与用户的潜在需求的一致性,提高了信息推送的精确度。能够在推送适量数据的情况下,满足用户的需求,减少信息推送系统的数据发送量,减少了数据推送过程中带宽资源的浪费。另外,由于本申请实施例只是对一个聚类中的推送对象提取关键词,而无需对所有的基准推送对象都提取关键词,因此,提取出的关键词数量少,加快了后续关键词的排序过程,提高了获取到目标关键词的速度。附图说明图1为本申请实施例一种确定推送信息的方法的流程图;图2为本申请实施例中计算文本相关性值的方法流程图;图3为本申请实施例中计算行为相关性值的方法流程图;图4为本申请实施例一种确定推送信息的装置的结构示意图。具体实施方式本申请实施例提供一种确定推送信息的方法,所述推送信息为描述推送对象的数据信息,该方法包括:当检测到用户浏览任一网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类算法得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中每个推送对象对应的关键词组得到该对象聚类的关键词组;获取所述至少一个对象聚类对应的目标关键词组,根据所述目标关键词组从信息推送系统中获取推送信息。本申请实施例所提供的方法根据待推送信息的特性将推送信息进行聚类,然后根据聚类中每个推送对象的关键词提取聚类的关键词。当需要向用户推送信息时,则可根据用户当前浏览网页内容的上下文场景以及其他场景确定推送对象,然后确定基准推送对象对应的对象聚类,从而根据对象聚类对应的关键词确定需要向用户推送的信息。通过本申请提供的方法能够基于内容相关与行为本文档来自技高网
...

【技术保护点】
一种确定推送信息的方法,其特征在于,所述推送信息为描述推送对象的数据信息,该方法包括:当检测到用户浏览网页内容时,根据预存的用户信息和/或网页内容信息确定基准推送对象;确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推送对象的文本相关性值及行为相关性值进行聚类得到的多个推送对象的集合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象聚类中推送对象对应的关键词得到该对象聚类的关键词;获取所述至少一个对象聚类对应的目标关键词,根据所述目标关键词从信息推送系统中获取推送信息。

【技术特征摘要】
1.一种确定推送信息的方法,其特征在于,所述推送信息为描述推送对
象的数据信息,该方法包括:
当检测到用户浏览网页内容时,根据预存的用户信息和/或网页内容信息确
定基准推送对象;
确定所述基准推送对象对应的至少一个对象聚类,所述对象聚类是利用推
送对象的文本相关性值及行为相关性值进行聚类得到的多个推送对象的集
合;其中,根据推送对象对应的文本介绍信息得到推送对象的文本相关性值,
根据用户对推送对象的操作行为得到推送对象的行为相关性值,并根据对象
聚类中推送对象对应的关键词得到该对象聚类的关键词;
获取所述至少一个对象聚类对应的目标关键词,根据所述目标关键词从信
息推送系统中获取推送信息。
2.如权利要求1所述的方法,其特征在于,所述根据推送对象对应文本
介绍信息得到推送对象的文本相关性值包括:
对所述推送对象对应文本介绍信息进行分词处理,得到每个推送对象的第
一关键词组,该第一关键词组中包括多个关键词;
根据各推送对象的第一关键词组之间的相似度,计算得到各推送对象之间
的文本相关性值。
3.如权利要求1所述的方法,其特征在于,所述根据用户对推送对象的
操作行为得到推送对象的行为相关性值包括:
获取每个推送对象对应的操作行为数据;
根据预设的每类操作行为与行为值之间的对应关系,确定每个推送对象对
应的行为值;
基于每个推送对象对应的行为值进行相关性计算,得到推送对象与推送对
象之间的行为相关性值。
4.如权利要求1-3任一所述的方法,其特征在于,根据预存的用户信息

\t确定基准推送对象包括:
获取所述用户对应的用户标识;
根据所述用户标识获取预存的该用户标识对应的基准推送对象。
5.如权利要求1所述的方法,其特征在于,根据对象聚类中推送对象对
应的关键词得到该对象聚类的关键词包括:
获取对象聚类中推送对象对应的关键词;
确定所述关键词中每个关键词重复出现的次数,并根据所述重复出现的次
数对关键词进行排序;
根据所述排序从关键词中选取K个关键词作为所述对象聚类的关键词,其
中,K为正整数。
6.一种确定推送信息的装置,其特征在于,所述推送信息为描述推送对

【专利技术属性】
技术研发人员:杨志雄苏煜邓中华
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1