一种给信息流标注标签的方法和装置制造方法及图纸

技术编号:15840815 阅读:34 留言:0更新日期:2017-07-18 16:52
本发明专利技术提供了一种给信息流标注标签的方法和装置。所述方法包括:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。

Method and device for tagging information flow

The invention provides a method and a device for tagging an information flow. The method includes: third party application users to install on the terminal to determine the user interest degree based on different labels; determine the information flow to label the matching degree of interest and the user of the information flow based on click; the matching degree according to the preset selected corresponding to a certain number of tags to the information flow based annotation.

【技术实现步骤摘要】
一种给信息流标注标签的方法和装置
本专利技术涉及信息处理
,具体而言涉及一种给信息流标注标签的方法和装置。
技术介绍
随着互联网技术和智能移动终端技术的快速发展,很多在计算机终端上实现的功能(例如购物、阅读)也都可以在智能移动终端上实现,例如使用智能手机或平板电脑等。另外,这些功能的实现需要在智能移动终端上安装相应的应用程序。例如,网上购物,需要安装例如淘宝客户端,听音乐需要安装音乐播放器客户端等。由此,很多软件公司提供了应用商店或应用市场,例如豌豆荚或者PP助手等。用户可以打开应用商店或者应用市场,从而能够快速搜索和下载所需要的各种应用程序,包括影音播放类、系统工具类、通讯社交类、网上购物类、阅读类等,当然还可以下载游戏等休闲娱乐类应用程序(APP)。为了不断提升用户使用应用商店或者应用市场的良好体验感,目前的应用商店或应用市场除了能够将应用直接展示给用户之外,如图1A所示,还提供了一种新的应用发行方式:在应用商店增加信息流,通过有趣的文章、短视频或头条新闻等对应用进行介绍和推销,打开信息流能看到文章内容、视频或新闻等,并且页面底部会有提供该信息流的可供下载的应用,如图1A和图1B所示,当点击图1A所示的信息流展示页面中的新闻“知道这些才算会玩UC浏览器”时,进入图1B所示的页面,上面除了介绍这篇新闻的详细内容时,页面底部还提供了该新闻的提供者-第三方应用“UC浏览器”及更新(或下载)按钮。然而,“信息流”的信息来源渠道很多,许多渠道提供的信息流缺乏对信息的描述,另外各渠道对信息描述的规范不统一,而且信息流的使用方-应用商店或应用市场目前没有一个好的方法来统一描述来自各种渠道的带有不规范描述的信息,由此给信息流标注标签的工作无法借助工具自动完成,而依赖人工实现标注标签,则费时费力、不容易做。在信息流没有标注标签的情况下,会导致开展与信息本身相关的个性化推荐信息流的业务会遇到很多困难。
技术实现思路
本专利技术的目的在于提供一种给信息流标注标签的方法和装置,以改善上述问题。本专利技术的第一实施例提供了一种给信息流标注标签的方法,其包括:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。本专利技术的第二实施例提供了一种给信息流标注标签的装置,其包括:兴趣度确定单元,用于基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;匹配度确定单元,用于基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;标注单元,用于基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。其中通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。其中通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。根据本专利技术的给信息流标注标签的方法和装置,通过统计用户在其使用的终端上安装的第三方应用和用户点击信息流的情况,能够分析出用户对标签的兴趣度,进而分析出用户点击过的信息流与标签的匹配度,从而可以选取匹配度最高的标签作为该信息流的标签,对其进行标注,由此可以实现对应用商店或应用市场中提供的信息流自动标注标签,解决了人工标注标签的费时费力、不容易完成的问题,而且通过为信息流自动标注标签,有利于后续开展的与信息流本身相关的个性化推荐信息流的业务。附图说明图1A是现有的应用商店采用信息流方式推荐应用的一个实例截图;图1B是信息流的一个信息的详情页的一个实例截图;图2是本专利技术实施例提供的给信息流标注标签的方法的流程图;图3是本发实施例提供的给信息流标注标签的装置的示意性框图。具体实施方式下面将结合本专利技术实施例和附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。专利技术人提供的本方案的主要思路是:通过用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于用户对于不同标签的兴趣度以及该用户点击信息流的情况来确定信息流对标签的匹配度;在得到了信息流对标签的匹配度后,基于所述匹配度按预设方式选取一定数量的标签作为所述信息流的标签,给所述信息流标注上。图2是本专利技术的给信息流标注标签的方法的流程图。如图2所示,本专利技术的给信息流标注标签的方法包括以下步骤:S1:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度。基于上述思路,需要统计一个用户在其使用的终端上到目前为止都安装了哪些第三方应用。通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。这样,基于这些安装的第三方应用来确定该用户对于不同标签的兴趣度。首先计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度,计算方法如下:其中:cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度;ct1p,i表示用户p在终端上在N天内安装了预置应用库里的第三方应用i并保持到今天的天数,其中用户p在N天内没有安装第三方应用i时ct1p,i为N;tagi,j表示第三方应用i是否具有预置标签集合里的标签j,其中当有标签j时tagi,j为1,否则为0;表示第三方应用i具有的预置标签集合里的标签数量的累加之和;n表示预置应用库里的第三方应用的数量;m表示预置标签集合里的标签数量;N为大于0的整数。N可以根据实践需要自行设定天数,例如60天、90天、180天等。本领域技术人员都知道开发应用商店或应用市场的目的和作用,应用商店或应用市场里预置了应用库,该应用库里放置了由不同第三方应用程序开发商开发的大量的各种应用。另外,应用商店或应用市场提供的第三方应用都具有1个或多个标签,这些标签也都来自于在开发应用商店或应用市场时预置的标签集合,这里不对这些常规技术做过多介绍了。通过以上运算就可以统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度。另外,一个用户通常会在其使用的终端上安装的多个第三方应用,所以需要将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度,方法本文档来自技高网
...
一种给信息流标注标签的方法和装置

【技术保护点】
一种给信息流标注标签的方法,其包括:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。

【技术特征摘要】
1.一种给信息流标注标签的方法,其包括:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。2.根据权利要求1所述的方法,其特征在于在基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度的步骤中,通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。3.根据权利要求1或2所述的方法,其特征在于在基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度的步骤中,首先计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度,计算方法如下:其中:cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度;ct1p,i表示用户p在终端上在N天内安装了预置应用库里的第三方应用i并保持到今天的天数,其中用户p在N天内无安装时ct1p,i为N;tagi,j表示第三方应用i是否具有预置标签集合里的标签j,其中当有标签j时tagi,j为1,否则为0;表示第三方应用i具有的预置标签集合里的标签数量的累加之和;n表示预置应用库里的第三方应用的数量;m表示预置标签集合里的标签数量;N为大于0的整数;然后将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度,方法如下:其中:intp,j表示某个用户p对于预置标签集合里的标签j的兴趣度;D表示用户p在终端上安装的预置应用库里的第三方应用的数量。4.根据权利要求1所述的方法,其特征在于在基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度的步骤中,通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。5.根据权利要求1或4所述的方法,其特征在于获得信息流对标签的匹配度的方法如下:其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的匹配度;ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;intp,j表示用户p对于预置标签集合里的标签j的兴趣度;m表示预置标签集合里的标签数量;U表示预置信息流库里的信息流数量;F表示点击过信息流l的用户数量;N为大于0的整数。6.根据权利要求1或4所述的方法,其特征在于获得信息流对标签的匹配度的方法如下:首先通过统计用户对信息流的点击情况和所述用户对于不同标签的兴趣度,计算所述用户所点击的信息流对于标签集合里的不同标签的第一匹配度,计算方法如下:其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;intp,j表示用户p对于预置标签集合里的标签j的兴趣度;m表示预置标签集合里的标签数量;U表示预置信息流库里的信息流数量;F表示点击过信息流l的用户数量;N为大于0的整数;然后,对所述第一匹配度进行标准化处理,得出信息流对标签的最终匹配度,方法如下:其中:ptagl,j表示用户所点击的信息流l与预置标签集合里的标签j之间的匹配度;Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;

【专利技术属性】
技术研发人员:潘岸腾
申请(专利权)人:广州优视网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1