一种推送列表多样性的评测方法及系统技术方案

技术编号:12743088 阅读:54 留言:0更新日期:2016-01-21 10:25
本申请公开了一种推送列表多样性的评测方法:设定用户群集合,用户群集合中包括多个用户;设定项目集合,项目集合中包括多个推送项目;为每个用户确定一个推送列表,推送列表中包括一个或多个项目集合中的推送项目;按照推送列表中推送项目的数量,对用户进行排序,得到用户序列;建立直角坐标系,根据用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标;根据用户坐标在直角坐标系中,生成推送列表曲线,并计算推送列表曲线的投影面积;以投影面积作为推送列表的多样性指数;利用多样性指数对用户列表的多样性程度进行评测,得到评测结果。本发明专利技术显著的降低了推送列表多样性计算的次数和复杂程度,减少损耗。

【技术实现步骤摘要】

本申请涉及数据处理领域,具体地说,涉及一种推送列表多样性的评测方法及系 统。
技术介绍
在当前,随着多媒体技术和网络信息传播技术的高度成熟,通过网络播放并浏览 多媒体视频,早已成为成千上万用户的习惯。用户浏览网络视频的途径也非常多样化,例如 PC、手机、平板电脑或网络电视等各类终端,都可以实现网络视频的功能。互联网上的网络 视频数量极大,而且涵盖的种类范围也非常广泛。为便于用户获悉所需要的网络视频,往往 会利用大数据分析等数据统计分析手段,发现用户可能会感兴趣的网络视频,并向用户推 送。 从用户群的全局来说,可以分析推送给每个用户的推送列表的差异性,来计算推 送列表的多样性。不同用户的推送列表之间,差异性越大,则说明推送列表的多样性越高, 表示对用户推送的针对性和个性化程度越强;反之,如果推送列表之间差异性越小则多样 性越低,对用户推送的针对性和个性化程度越弱。合理的推送机制,便是尽可能的提高推送 列表的多样性。 当前多样性计算方法,都是计算推送列表之前的相关性得到,其缺陷在于,必须计 算用户群中任意两个用户的推送列表的相似度,计算复杂度很高,消耗大量的运算资源。
技术实现思路
有鉴于此,本申请所要解决的技术问题是提供了一种推送列表多样性的评测方法 及系统,简化了推送列表多样性的计算方式,降低了计算过程的复杂程度。 为了解决上述技术问题,本申请有如下技术方案: -种推送列表多样性的评测方法,所述方法包括: 设定用户群集合,所述用户群集合中包括多个用户;设定项目集合,所述项目集合 中包括多个推送项目; 为每个用户确定一个推送列表,所述推送列表中包括一个或多个项目集合中的推 送项目; 按照推送列表中推送项目的数量,对用户进行排序,得到用户序列; 建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每 个用户确定其在直角坐标系中的坐标; 根据所述用户坐标在所述直角坐标系中,生成推送列表曲线,并计算所述推送列 表曲线的投影面积;以所述投影面积作为推送列表的多样性指数; 利用所述多样性指数对所述用户列表的多样性程度进行评测,得到评测结果。 优选的,所述按照推送列表中推送项目的数量,对用户进行排序具体为: 按照推送列表中推送项目的数量,对用户进行升序排序。 优选的,所述根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用 户确定其在直角坐标系中的坐标具体为: 将用户在所述用户序列中的序列号作为横坐标;将用户的推送列表中推送项目的 数量作为纵坐标。 优选的,所述根据所述用户坐标在所述直角坐标系中,生成推送列表曲线具体 为: 连接所述直角坐标系中的各个坐标点,生成推送列表曲线。 优选的,所述计算所述推送列表曲线的投影面积,以所述投影面积作为推送列表 的多样性指数具体为: 其中,diversity代表多样性指数,M代表项目集合中推送项目的数量,N代表用户 群集合中用户的数量,k代表用户在用户序列中的序号,m k代表在用户序列中,序号为k的 用户的推送列表中推送项目的数量。 一种推送列表多样性的评测系统,所述系统包括: 集合模块,用于设定用户群集合,所述用户群集合中包括多个用户;设定项目集 合,所述项目集合中包括多个推送项目; 列表模块,用于为每个用户确定一个推送列表,所述推送列表中包括一个或多个 项目集合中的推送项目; 运算模块,用于按照推送列表中推送项目的数量,对用户进行排序,得到用户序 列;建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用 户确定其在直角坐标系中的坐标;根据所述用户坐标在所述直角坐标系中,生成推送列表 曲线,并计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指 数; 评测模块,用于利用所述多样性指数对所述用户列表的多样性程度进行评测,得 到评测结果。 优选的,所述运算模块包括: 序列单元,用于按照推送列表中推送项目的数量,对用户进行升序排序; 坐标系单元,用于建立直角坐标系,根据所述用户序列,及用户的推送列表中推送 项目的数量,为每个用户确定其在直角坐标系中的坐标;根据所述用户坐标在所述直角坐 标系中,生成推送列表曲线; 投影单元,用于计算所述推送列表曲线的投影面积;以所述投影面积作为推送列 表的多样性指数。 优选的,所述坐标系单元根据所述用户序列,及用户的推送列表中推送项目的数 量,为每个用户确定其在直角坐标系中的坐标具体为: 将用户在所述用户序列中的序列号作为横坐标;将用户的推送列表中推送项目的 数量作为纵坐标。 优选的,所述坐标系单元根据所述用户坐标在所述直角坐标系中,生成推送列表 曲线具体为: 连接所述直角坐标系中的各个坐标点,生成推送列表曲线。 优选的,所述投影单元计算所述推送列表曲线的投影面积,以所述投影面积作为 推送列表的多样性指数具体为: 其中,diversity代表多样性指数,M代表项目集合中推送项目的数量,N代表用户 群集合中用户的数量,k代表用户在用户序列中的序号,m k代表在用户序列中,序号为k的 用户的推送列表中推送项目的数量。 与现有技术相比,本申请所述的方法和系统,达到了如下效果: 显著的降低了推送列表多样性计算的次数和复杂程度,减少了多样性评测过程中 对运算资源的消耗。 当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。【附图说明】 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中: 图1为本申请实施例所述方法流程图; 图2为本申请实施例所述推送列表曲线的投影面积示意图; 图3为本申请实施例所述系统结构示意图。【具体实施方式】 如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员 应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以 名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在 通篇说明书及权利要求当中所提及的"包含"为一开放式用语,故应解释成"包含但不限定 于"。"大致"是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所 述技术问题,基本达到所述技术效果。此外,"耦接"一词在此包含任何直接及间接的电性 耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电 性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说 明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目 的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。 在现有技术当中,推送列表的多样性指数的计算方式,必须计算用户群中任意两 个用户的推送列表的相似度。也就是说,假设N个推送列表要两两组合计算,计算次数达到 N*N。从数学层面来说,其复杂度记作0(N2)。其计算复杂度很高,耗费运算资源。所以本申 请中,将公开一种更简单的推送列表多样性的评测方法及系统,显著的降低多样性指数计 算的复杂程度。 参见图1所示,为本申请所述方法的具体实施例。本实施例中所述方法包括以下 步骤: 步骤101、设定用户群集合,所本文档来自技高网...

【技术保护点】
一种推送列表多样性的评测方法,其特征在于,所述方法包括:设定用户群集合,所述用户群集合中包括多个用户;设定项目集合,所述项目集合中包括多个推送项目;为每个用户确定一个推送列表,所述推送列表中包括一个或多个项目集合中的推送项目;按照推送列表中推送项目的数量,对用户进行排序,得到用户序列;建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标;根据所述用户坐标在所述直角坐标系中,生成推送列表曲线,并计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指数;利用所述多样性指数对所述用户列表的多样性程度进行评测,得到评测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:袁树仑章岑杨田周盛潘柏宇王冀
申请(专利权)人:合一网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1