一种信息推送方法、装置及系统制造方法及图纸

技术编号:3845585 阅读:237 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例涉及通信领域一种信息推送方法,获取用户感兴趣的网页;基于所述用户感兴趣的网页获取用户兴趣;根据所述用户兴趣确定推送给所述用户的信息。本发明专利技术实施例还提供一种信息推送装置及系统。本发明专利技术实施例可以根据用户浏览的网页获得用户兴趣,从而根据该用户兴趣推送信息给用户,有效提高了推送的准确性,避免用户接收大量不感兴趣的垃圾信息。

【技术实现步骤摘要】

本专利技术涉及通信
,尤其涉及一种信息推送方法、装置及系统
技术介绍
推送技术(PUSH)是一种基于客户服务器机制,由服务器主动将信息发往客户端 的技术,其传送的信息通常是用户事先预定的。同传统的拉技术(PULL)相比,两者最主要 的区别在于前者的是由服务器主动发送信息,而后者则是由客户机主动请求信息。推送技术的本质在于根据信息主动寻找用户,其优势在于信息的主动性和及时 性,通过使用该技术,可以尽快的将信息推送到用户面前;其弱势在于信息的准确性较差, 由于简单的筛选机制取代了人工的选择,必然会使推送信息和用户的需求间存在一定的差已与本专利技术相关的现有技术涉及的为WAP中的推送技术,WAP中的推送技术是将包 括文字、声音、图像等在内的数字信息推送给用户。现有技术一的技术方案如下位置推送应用服务器获得移动终端用户或用户群的位置信息,基于所述位置信息 向所述移动终端用户或用户群推送与所述位置和/或地点信息相关联的消息和/或内容。专利技术人在实现本专利技术过程中发现,现有技术一至少存在如下缺点现有技术一提供给用户与其所处的位置和/或地点信息相关联的消息和/或内 容,而这种消息和/或内容只依赖于对用户当前位置的分析,从而导致用户走进或路过某 些地点都可能接收到推送消息,而这些推送信息有可能是用户不感兴趣的,因此造成大量 的垃圾信息。
技术实现思路
本专利技术实施例提供一种信息推送方法、装置及系统,实现结合用户兴趣推送信息 给用户,避免用户接收大量不感兴趣的垃圾信息。本专利技术实施例是通过以下技术方案实现的本专利技术实施例提供一种信息推送方法,包括获取用户感兴趣的网页;基于所述用户感兴趣的网页获取用户兴趣;根据所述用户兴趣确定推送给所述用户的信息。本专利技术实施例提供一种信息推送装置,包括 第一获取单元,用于获取用户感兴趣的网页;第二获取单元,用于基于所述用户感兴趣的网页获取用户兴趣;推送单元,用于根据所述用户兴趣确定推送给所述用户的信息。本专利技术实施例提供一种信息推送系统,包括第一数据库、第二数据库及信息推送 装置;所述第二数据库,用于存储预推送信息;所述信息推送装置,用于根据用户浏览的网页获取用户兴趣,根据所述用户兴趣 确定推送给所述用户的预推送信息;所述第一数据库,用于存储用户兴趣。由上述本专利技术实施例提供的技术方案可以看出,本专利技术实施例可以根据用户浏览 的网页获得用户兴趣,从而根据该用户兴趣推送信息给用户,有效提高了推送的准确性,避 免用户接收大量不感兴趣的垃圾信息。附图说明图1为本专利技术实施例信息推送方法流程图;图2为本专利技术实施例用户A当前兴趣示意图;图3为本专利技术实施例信息推送装置结构示意图;图4为图3所述信息推送装置中第一获取单元结构示意图;图5为图3所述信息推送装置中第二获取单元结构示意图;图6为图3所述信息推送装置中推送单元结构示意图;图7为图6所示推送单元中第一推送子单元结构示意图;图8为图6所示推送单元中第二推送子单元结构示意图;图9为本专利技术实施例信息推送系统结构示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,可以理解的是,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施 例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种信息推送方法,包括如下步骤获取用户感兴趣的网页;基于所述用户感兴趣的网页获取用户兴趣;根据所述用户兴趣确定推送给所述用户的信息。本专利技术实施例提供的信息推送方法可以结合用户兴趣推送信息给用户,避免用户 接收大量的垃圾信息。本专利技术又一实施例提供一种信息推送方法,以图1中所示为例,包括如下步骤步骤10:获取用户感兴趣的网页; 所述获取用户感兴趣的网页包括统计一个时间窗口内用户访问的每个网页;确 定所述时间窗口内用户访问的每个网页的文本内容所属的类别;统计用户访问各类别网页 的频度,确定访问频度满足规定阈值的网页为用户感兴趣的网页。还包括根据用户浏览网 页速度动态调整所述时间窗口的大小。所述统计一个时间窗口内用户访问的每个网页是以用户当前浏览时间为开始,以 一个符合用户浏览速度习惯的时间范围为基准,分析在该时间范围内用户访问的每个网 页。所述时间窗口的大小应该保证能够反映用户当前时间的集中兴趣,而由于不同用户会有不同的浏览速度和习惯,因此,时间窗口的初始取值可以设定为一固定值,之后可以根据 用户浏览速度和习惯进行自动调节。本专利技术实施例提供的一种时间窗口大小的调节方法如 下1)统计用户历史访问密度D = ^T其中,T为一段历史时间,M为用户在T时间段 内浏览网页数量;a2)初始时间窗口设定值为i = 其中,α为一经验值,用来调节时间窗口大小,且α大小可调,在一规定时间后统计浏览数量总量,根据公式《二对α进行调 整; M'3) 一定时间周期后,再次计算用户在一个新的时间段内的访问密度j4)调节后的时间窗口值为< = + D + d'可以理解的是,调节时间窗口的方法并不局限于此,本领域技术人员根据本专利技术 实施例当前描述可以轻易想到的其他调节方案均在本专利技术保护范围内,例如,可以规定在 当前时间窗口内统计用户访问网页的个数满足规定阈值时,则将时间窗口调小一特定值等 等,或低于某一规定阈值时,将时间窗口调大一特定值。根据所述时间窗口内用户访问网页的统一资源定位地址(URL,UniformResource Locator),获得网页的文本内容,确定文本内容所属的类别;对每一类别网页进行访问频度 统计,确定访问频度满足规定阈值的网页为用户感兴趣的网页。其中根据所述时间窗口内用户访问网页的URL地址获得网页的文本内容的过程 包括将所述用户访问网页的URL地址去除掉无用网页和无法访问的网页得到筛选后的 URL地址,对所述筛选后的URL地址进行链接,提取网页标题和文本信息。所述无用网页包 括不包含具体文本内容的门户网站首页、导航网站首页等。如下所示为一篇网页源文件的 文字信息的分布一般 其中链接4,链接5既是链接信息,也是正文信息。匹配〈title〉获得标题信息,从上述网页获得的正文和有用的链接信息,如正文 1,链接4,正文2,链接5,正文3,也就是通过URL地址获得的文本内容包括所述URL地址对 应的网页的标题和正文信息。所述确定文本内容所属的类别主要是根据获得的网页的标题和正文信息对照预 先定义的主题类别为网页确定所属类别。可以预先定义多个主题类别,例如包括体育、餐饮、IT、房地产、汽车或旅游等等。本专利技术实施例根据获得的网页的标题和正文信息确定网页文本内容所属类别的方法可以 采用现有技术方案,例如现有的决策树方法、支持向量机(SVM,Support Vector Machine) 或朴素贝叶斯等等,对此本专利技术实施例不做限定。所述统计频度是对用户访问相同类别的网页的次数进行统计,获得每个类别网页 的用户访问频度,确定访问频度满足规定阈值的网页为用户感兴趣的网页。步骤11 基于所述用户感兴趣的网页获取用户兴趣;基于所述用户感兴趣的网页获取用户兴趣包括对所述用户感兴趣的网页进行文 本分析,获得网页的主题;将出现重复关键词的各主题归并到一起组成一个话题组,将本文档来自技高网...

【技术保护点】
一种信息推送方法,其特征在于,包括:获取用户感兴趣的网页;基于所述用户感兴趣的网页获取用户兴趣;根据所述用户兴趣确定推送给所述用户的信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:汪芳山杜家春佘莉刘震傅彦
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1