关联知识的推送方法和装置制造方法及图纸

技术编号:10292104 阅读:125 留言:0更新日期:2014-08-06 19:37
本发明专利技术提供了一种关联知识的推送方法,包括:当用户访问资源时,确定用户的身份信息;在资源中检索具有与用户的身份信息一致的身份信息的知识;将检索到的知识中的具有最高权重的知识推送给用户。本发明专利技术还提供了一种关联知识的推送装置,包括:身份模块,用于当用户访问资源时,确定用户的身份信息;检索模块,用于在资源中检索具有与用户的身份信息一致的身份信息的知识;推送模块,用于将检索到的知识中的具有最高权重的知识推送给用户。本发明专利技术提高了用户体验。

【技术实现步骤摘要】
关联知识的推送方法和装置
本专利技术涉及信息处理
,具体而言,涉及一种关联知识的推送方法和装置。
技术介绍
为了帮助用户尽快找到所关心的知识,现有的图书系统和互联网网站等采用知识推送的方式主动推送相关的知识给用户。为了实现知识推送,应当预先做好只是关联。目前知识关联主要是基于内容本身的一些元数据属性进行关联,需要前期投入大量的数据加工,投入成本比较高。在进行数据加工时,需要聘请大量专家制定加工规范,制定完毕后还需要请加工人员按照标准进行加工,如:建立期刊文献数据库时,不仅需要对期刊的元数据属性进行加工,同时需要对内容进行深度结构化,例如参考文献,加工一篇文献的工作量都比较大。除了元数据关联方式外,现在也有部分服务通过分词技术对文献进行分词,通过分词结果构建知识之间的关联,这种方式从一定程度上可以解决部分关联问题,但是关联结果不够准确。
技术实现思路
本专利技术旨在提供关联知识的推送方法和装置,以解决上述的问题。在本专利技术的实施例中,提供了一种关联知识的推送方法,包括:当用户访问资源时,确定用户的身份信息;在资源中检索具有与用户的身份信息一致的身份信息的知识;将检索到的知识中的具有最高权重的知识推送给用户。在本专利技术的实施例中,提供了一种关联知识的推送装置,包括:身份模块,用于当用户访问资源时,确定用户的身份信息;检索模块,用于在资源中检索具有与用户的身份信息一致的身份信息的知识;推送模块,用于将检索到的知识中的具有最高权重的知识推送给用户。本专利技术上述实施例的关联知识的推送方法和装置因为针对用户身份来推送知识,所以克服了现有技术关联不够准确的问题,提高了用户体验。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1示出了根据本专利技术实施例的关联知识的推送方法的流程图;图2示出了根据本专利技术实施例的关联知识的推送装置的示意图。具体实施方式下面将参考附图并结合实施例,来详细说明本专利技术。图1示出了根据本专利技术实施例的关联知识的推送方法的流程图,包括:步骤S10,当用户访问资源时,确定用户的身份信息;步骤S20,在资源中检索具有与用户的身份信息一致的身份信息的知识;步骤S30,将检索到的知识中的具有最高权重的知识推送给用户。现有技术在分析关联知识时没有考虑用户身份,而本方法则根据用户身份信息来推送知识,这可以加强知识与用户的关联,提高用户期望的命中率,提高了用户体验。优选地,本方法还包括:当资源中的知识被访问时,记录关于访问的身份信息和行为信息;对于各个知识,根据其记录的身份信息和行为信息设置其权重。本优选实施例预先收集了身份信息和行为信息,从而能实现知识与用户的关联,并且能反映不同类型用户的不同行为类型。优选地,记录关于访问的身份信息和行为信息包括:记录访问知识的用户的ID,ID关联到预先登记的用户的属性信息,属性信息包括以下至少一项:职业、所属机构和教育程度;记录访问的行为类型,类型包括以下至少一种:浏览、收藏、下载和购买;记录访问的发生时间;记录所访问知识的ID。专利技术人通过大量实验,发现职业、所属机构和教育程度最能反映用户的知识兴趣方向,而浏览、收藏、下载和购买最能反映用户对当前知识感兴趣的程度。本优选实施例以职业、所属机构和教育程度作为身份信息,以浏览、收藏、下载和购买作为行为信息,因此知识的关联效果比较好。下表是根据本专利技术优选实施例的一个记录表格:字段字段类型字段描述OP_IDnumber主键OP_TYPEvarchar行为类型OP_DATEdate发生时间OP_USERIDnumber用户IDOP_RESOURCEIDnumber知识ID可以利用数据库来管理以上记录,其中OP_ID是该记录在数据库中的主键。优选地,对于各个知识,根据其记录的身份信息和行为信息设置其权重包括:设置Wj=f(a,t),其中,以知识的ID遍历各个知识,j是指当前遍历的知识根据其用户的ID所关联属性信息所属的类别,Wj是指当前遍历的知识对于j的权重,a是指当前遍历的知识的行为类别的权值,各种行为类别具有相应的权值,t是设置的时间段,f(a,t)对于a是求和,对于t是发生时间越新,则使a的权重越大。可以采用下表记录根据记录的身份信息和行为信息设置的权重:字段字段类型字段描述OP_RESOURCEIDNUMBER知识IDWEIGHTNUMBER知识的权重值WjTYPEVARCHARJ优选地,f(a,t)=a浏览*l+a收藏*n+a下载*x+a购买*y,其中,l、n、x、y分别代表在设置时间t内的浏览、收藏、下载、购买的次数。a浏览表示浏览行为的权重、a收藏表示收藏行为的权重、a下载表示下载行为的权重、a购买表示购买行为的权重。该表达式比较简单,很容易通过计算机编程来实现。优选地,其中,li、ni、xi、yi分别代表在设置时间t被分割的时间段i内的浏览、收藏、下载、购买的次数,i是时间段的序号,m为设置时间t被分割的时间段的序号的最大值,时间越远,i越小,时间最远的时间段的i的值为1,p是设置的时间衰减参数,取值为小于1大于0的小数。a浏览表示浏览行为的权重、a收藏表示收藏行为的权重、a下载表示下载行为的权重、a购买表示购买行为的权重。该表达式比较简单,很容易通过计算机编程来实现。本优选实施例还考虑了时间衰减的因素。例如设置时间t为1年,时间单位为1个月,则m=12,因为p是小于1大于0的小数,则距今10个月的访问造成的权值将乘以p10的系数,而当月的访问造成的权值将乘以1的系数,即没有衰减。也可以时间t范围为当前时间到两年前,时间段单位设置为一星期,这两个值都可以进行调整。优选地,设置a浏览≤a收藏≤a下载≤a购买。专利技术人根据大量实验发现,浏览、收藏、下载、购买所表示的兴趣是:购买兴趣最大,收藏和下载次之,而浏览兴趣最低,因此设置a浏览≤a收藏≤a下载≤a购买能较好地命中用户感兴趣的知识。优选地,设置a浏览:a收藏:a下载:a购买=1:2:2:5;设置p=0.9。本优选实施例的数值是专利技术人经过大量实践后取得的最优数值。优选地,步骤S20包括:获取用户的ID关联的属性信息;根据属性信息确定j的值为q;在资源中检索Wq不为0或空值的知识。优选地,将检索到的知识中的具有最高权重的知识推送给用户。包括:将Wq排序;将Wq最大的前N个知识推荐给用户,其中,N是设置的数量。例如将职业为医生,在医院工作,教育程度为硕士以上定义为第1类,即j=1,将职业为学生,在医院工作,教育程度为学士以上定义为第2类,即j=2。有第1类和第2类的用户都访问过知识ID=10000的知识,则对该知识分别设置W1和W2。在当前有用户访问该知识ID=10000的知识时,则先确定当前用户的类别,例如属于第1类,然后检索到W1不为0或空值的知识,并将W1最大的前N条知识,例如N=5条知识推送该用户。如果检索到的知识的条数大于N,可以从检索到的知识中随机抽取N条,例如推荐系统默认显示最大为10条,那么默认会从权重最高的50条中随机选择10条推荐。推荐的内容可以采用XML方式进行显示,终端可以根据需要套用相应样式模板显示为最终页面。图2示出了根据本专利技术实施例的关联知识的本文档来自技高网...
关联知识的推送方法和装置

【技术保护点】
一种关联知识的推送方法,其特征在于,包括:当用户访问资源时,确定所述用户的身份信息;在所述资源中检索具有与所述用户的身份信息一致的身份信息的知识;将检索到的知识中的具有最高权重的知识推送给所述用户。

【技术特征摘要】
1.一种关联知识的推送方法,其特征在于,包括:当用户访问资源时,确定所述用户的身份信息;在所述资源中检索具有与所述用户的身份信息一致的身份信息的知识;将检索到的知识中的具有最高权重的知识推送给所述用户;当所述资源中的知识被访问时,记录关于访问的身份信息和行为信息;对于各个所述知识,根据其记录的所述身份信息和所述行为信息设置其权重Wj=f(a,t),其中,以所述知识的ID遍历各个所述知识,j是指当前遍历的知识根据其用户的ID所关联属性信息所属的类别,Wj是指当前遍历的知识对于j的权重,a是指当前遍历的知识的行为类别的权值,各种行为类别具有相应的权值,t是设置的时间段,f(a,t)对于a是求和,对于t是发生时间越新,则使a的权重越大。2.根据权利要求1所述的方法,其特征在于,记录关于访问的身份信息和行为信息包括:记录访问所述知识的用户的ID,所述ID关联到预先登记的所述用户的属性信息,所述属性信息包括以下至少一项:职业、所属机构和教育程度;记录所述访问的行为类型,所述类型包括以下至少一种:浏览、收藏、下载和购买;记录所述访问的发生时间;记录所访问知识的ID。3.根据权利要求1所述的方法,其特征在于,设置:f(a,t)=a浏览*l+a收藏*n+a下载*x+a购买*y;l、n、x、y分别代表在设置时间t内的浏览、收藏、下载、购买的次数;或者li、ni、xi、yi分别代表在设置时间t被分割的时间段i内的浏览、收藏、下载、购买的次数,i是时间段的序号,m为设置时间t被分割的时间段的序号的最大值,时间越远,i越小,时间最远的时间段的i的值为1,p是设置的时间衰减参数,取值为小于1大于0的小数...

【专利技术属性】
技术研发人员:陈长刚百华睿
申请(专利权)人:北大方正集团有限公司方正信息产业控股有限公司北京北大方正电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1