The invention provides a method and a device for tagging an information flow. The method includes: third party application users to install on the terminal to determine the user interest degree based on different labels; determine the information flow to label the matching degree of interest and the user of the information flow based on click; the matching degree according to the preset selected corresponding to a certain number of tags to the information flow based annotation.
【技术实现步骤摘要】
一种给信息流标注标签的方法和装置
本专利技术涉及信息处理
,具体而言涉及一种给信息流标注标签的方法和装置。
技术介绍
随着互联网技术和智能移动终端技术的快速发展,很多在计算机终端上实现的功能(例如购物、阅读)也都可以在智能移动终端上实现,例如使用智能手机或平板电脑等。另外,这些功能的实现需要在智能移动终端上安装相应的应用程序。例如,网上购物,需要安装例如淘宝客户端,听音乐需要安装音乐播放器客户端等。由此,很多软件公司提供了应用商店或应用市场,例如豌豆荚或者PP助手等。用户可以打开应用商店或者应用市场,从而能够快速搜索和下载所需要的各种应用程序,包括影音播放类、系统工具类、通讯社交类、网上购物类、阅读类等,当然还可以下载游戏等休闲娱乐类应用程序(APP)。为了不断提升用户使用应用商店或者应用市场的良好体验感,目前的应用商店或应用市场除了能够将应用直接展示给用户之外,如图1A所示,还提供了一种新的应用发行方式:在应用商店增加信息流,通过有趣的文章、短视频或头条新闻等对应用进行介绍和推销,打开信息流能看到文章内容、视频或新闻等,并且页面底部会有提供该信息流的可供下载的应用,如图1A和图1B所示,当点击图1A所示的信息流展示页面中的新闻“知道这些才算会玩UC浏览器”时,进入图1B所示的页面,上面除了介绍这篇新闻的详细内容时,页面底部还提供了该新闻的提供者-第三方应用“UC浏览器”及更新(或下载)按钮。然而,“信息流”的信息来源渠道很多,许多渠道提供的信息流缺乏对信息的描述,另外各渠道对信息描述的规范不统一,而且信息流的使用方-应用商店或应用市场目前没有一个好 ...
【技术保护点】
一种给信息流标注标签的方法,其包括:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。
【技术特征摘要】
1.一种给信息流标注标签的方法,其包括:基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度;基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度;基于所述匹配度按预设方式选取对应的一定数量标签给所述信息流标注。2.根据权利要求1所述的方法,其特征在于在基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度的步骤中,通过统计在一段天数内用户安装的预置应用库里的第三方应用具有的每个标签占该应用具有的所有标签的权重随时间衰减而得出该用户因安装了该第三方应用而对于标签集合里的不同标签的兴趣度,将该用户因在终端上安装的所有第三方应用而对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度。3.根据权利要求1或2所述的方法,其特征在于在基于用户在终端上安装的第三方应用确定该用户对于不同标签的兴趣度的步骤中,首先计算所述用户在终端上安装的每个第三方应用对于标签集合里的不同标签的兴趣度,计算方法如下:其中:cintp,i,j表示某个用户p在终端上安装的预置应用库里的第三方应用i对于标签集合里的标签j的兴趣度;ct1p,i表示用户p在终端上在N天内安装了预置应用库里的第三方应用i并保持到今天的天数,其中用户p在N天内无安装时ct1p,i为N;tagi,j表示第三方应用i是否具有预置标签集合里的标签j,其中当有标签j时tagi,j为1,否则为0;表示第三方应用i具有的预置标签集合里的标签数量的累加之和;n表示预置应用库里的第三方应用的数量;m表示预置标签集合里的标签数量;N为大于0的整数;然后将在终端上安装的所有第三方应用对于相同标签的兴趣度值进行累加,从而得出该用户对于不同标签的兴趣度,方法如下:其中:intp,j表示某个用户p对于预置标签集合里的标签j的兴趣度;D表示用户p在终端上安装的预置应用库里的第三方应用的数量。4.根据权利要求1所述的方法,其特征在于在基于所述兴趣度和用户对信息流的点击情况确定信息流对标签的匹配度的步骤中,通过对不同用户对于不同标签的兴趣度随着用户点击信息流的时间而衰减进行统计,得到信息流对标签的匹配度。5.根据权利要求1或4所述的方法,其特征在于获得信息流对标签的匹配度的方法如下:其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的匹配度;ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;intp,j表示用户p对于预置标签集合里的标签j的兴趣度;m表示预置标签集合里的标签数量;U表示预置信息流库里的信息流数量;F表示点击过信息流l的用户数量;N为大于0的整数。6.根据权利要求1或4所述的方法,其特征在于获得信息流对标签的匹配度的方法如下:首先通过统计用户对信息流的点击情况和所述用户对于不同标签的兴趣度,计算所述用户所点击的信息流对于标签集合里的不同标签的第一匹配度,计算方法如下:其中:Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;ct2p,l表示用户p最后一次点击信息流l距离今天的天数,其中用户p在N天内没有点击信息流l时ct2p,l为N;intp,j表示用户p对于预置标签集合里的标签j的兴趣度;m表示预置标签集合里的标签数量;U表示预置信息流库里的信息流数量;F表示点击过信息流l的用户数量;N为大于0的整数;然后,对所述第一匹配度进行标准化处理,得出信息流对标签的最终匹配度,方法如下:其中:ptagl,j表示用户所点击的信息流l与预置标签集合里的标签j之间的匹配度;Sl,j表示用户所点击的信息流l对于预置标签集合里的标签j的第一匹配度;
【专利技术属性】
技术研发人员:潘岸腾,
申请(专利权)人:广州优视网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。