推荐标签的方法和装置制造方法及图纸

技术编号:8834318 阅读:113 留言:0更新日期:2013-06-22 20:31
本发明专利技术提供了一种为用户推荐标签的方法及装置,该技术方案包括:接收当前用户对当前对象的当前评分;根据所述当前用户以及所述当前评分确定候选标签集;根据所述候选标签集中每一个候选标签的指标值进行排序;根据所述排序为所述当前用户推荐标签。利用本发明专利技术的技术方案,可以进一步改善标签的推荐。

【技术实现步骤摘要】
推荐标签的方法和装置
本专利技术涉及一种推荐标签的方法及装置,特别涉及一种根据用户的评分进行标签推荐的方法和装置。
技术介绍
通过标签(tag)允许用户用关键词或术语来标注各种对象(例如图片,文章,视频等)。对于网站来说,标签可以扩大资源的标签集,从而增加检索资源时的索引集;而对于用户来说,标签推荐的目的是增强用户在标注过程中的用户体验,方便用户快速进行标签标注。作为web2.0的一个重要特性,标签推荐对如何改进标签推荐使其更好的帮助用户分类整理和查询各类信息,以及对网络搜索、个性化搜索、网络资源分类和聚类等方面都有着很大的价值。在一些现有技术中,可以推荐个性化的标签,例如,根据用户桌面或历史信息进行推荐。在另外一些采用协同过滤的现有技术中,可根据相同社区的人具有相似兴趣的原理,为相同社区的用户推荐相似的标签。此外,现有技术中,还允许用户给对象的某一方面或在总体上进行评价,通常用打分的形式进行,通常用星数表示。例如,用户对于某篇文章的整体打了5分表示非常满意,或者,用户在某电子商务网站购书交易成功后,可以对商家服务的质量打3分表示一般。但并没有任何现有技术公开或教导根据评分进行标签的推荐,因此,现有技术仍然存在改进的空间。
技术实现思路
根据本专利技术的第一方面,提供了一种为用户推荐标签的方法,该方法包括:接收当前用户对当前对象的当前评分;根据所述当前用户以及所述当前评分确定候选标签集;根据所述候选标签集中候选标签的指标值进行排序;根据所述排序为所述当前用户推荐标签。根据本专利技术的第二方面,提供了一种为用户推荐标签的装置,该装置包括:评分部件,配置为接收当前用户对当前对象的当前评分;确定部件,配置为根据所述当前用户以及所述当前评分确定候选标签集;排序部件,配置为根据所述候选标签集中候选标签的指标值进行排序;推荐部件,根据所述排序为所述当前用户推荐标签。通过采用本专利技术所提供的方法和装置,可以实现根据用户的评分进行标签的推荐。附图说明从以下结合附图对各种示例性实施例的描述中,将进一步理解本专利技术的多个方面,在附图中:图1示出用来实现本专利技术实施方式的示例性计算系统100的框图。图2示出了在一个实施方式进行标签推荐的方法流程。图3示出了在第一个实施例中,为当前用户u针对对象i推荐标签时的流程图。图4示出了在另一个实施例通过概率生成模型的方式实现图2中步骤202、203的流程图。图5示出了现有技术中LDA图模型的示意图。图6示出了在一个实施例的用户标签概率生成模型示意图。图7示出了在一个实施例中LDA图模型的示意图。图8示出了在一个实施例中通过Gibbs采样进行参数推断的流程。图9示出了本申请公开的一种为用户推荐标签的装置示意图。具体实施方式下面对本专利技术的具体实施方式进行详细描述。所属
的技术人员知道,本专利技术可以体现为系统、方法或计算机程序产品。因此,本专利技术可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本专利技术还可以采取体现在任何有形的表达介质(mediumofexpression)中的计算机程序产品的形式,该介质中包含计算机可用的程序码。可以使用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质,计算机可读存储介质例如可以是——但不限于——电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、器件或传播介质、或前述各项的任何适当的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或前述各项的任何适当的组合。在本文语境中,计算机可读存储介质可以是任何含有或存储供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的有形介质。计算机可读信号介质可以包括例如在基带中或作为载波的一部分传播的带有计算机可读程序代码的数据信号。这样一种传播信号可以采取任何适当的形式,包括-但不限于-电磁的、光的或其任何适当的组合。计算机可读信号介质可以是不同于计算机可读存储介质的、可以传达、传播或传输供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的任何一种计算机可读介质。包含在计算机可读介质中的程序代码可以采用任何适当的介质传输,包括-但不限于-无线、有线、光缆、射频等等、或上述各项的任何适当的组合。用于执行本专利技术的操作的计算机程序码,可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言-诸如”C”程序设计语言或类似的程序设计语言。程序码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。以下参照按照本专利技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本专利技术。要明白的是,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流程图和/或框图中的方框中规定的功能/操作的装置。也可以把这些计算机程序指令存储在能指令计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instructionmeans)的制造品。也可以把计算机程序指令加载到计算机或其它可编程数据处理装置上,使得在计算机或其它可编程数据处理装置上执行一系列操作步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作的过程。现参看图1,示出了适于用来实现本专利技术实施方式的示例性计算系统100的框图。如所示,计算机系统100可以包括:CPU(中央处理单元)101、RAM(随机存取存储器)102、ROM(只读存储器)103、系统总线104、硬盘控制器105、键盘控制器106、串行接口控制器107、并行接口控制器108、显示控制器109、硬盘110、键盘111、串行外部设备112、并行外部设备113和显示器114。在这些设备中,与系统总线104耦合的有CPU101、RAM102、ROM103、硬盘控制器105、键盘控制器106、串行控制器107、并行控制器108和显示控制器109。硬盘110与硬盘控制器105耦合,键盘111与键盘控制器106耦合,串行外部设备1本文档来自技高网
...
推荐标签的方法和装置

【技术保护点】
一种为用户推荐标签的方法,该方法包括:接收当前用户对当前对象的当前评分;根据所述当前用户以及所述当前评分确定候选标签集;根据所述候选标签集中候选标签的指标值进行排序;根据所述排序为所述当前用户推荐标签。

【技术特征摘要】
1.一种为用户推荐标签的方法,该方法包括:接收当前用户对当前对象的当前评分;根据所述当前用户以及所述当前评分确定候选标签集;根据所述候选标签集中候选标签的指标值进行排序;根据所述排序为所述当前用户推荐标签,其中,根据所述当前用户以及所述当前评分确定候选标签集包括:根据预先确定的用户在不同评分等级下与历史标签的关联关系确定所述当前用户在所述当前评分下的历史标签作为所述候选标签集,其中,所述用户在不同评分等级下与历史标签内容的关联关系包括对象间两两相似度,所述对象间两两相似度是根据所述对象历史标签的内容相似度以及不同用户对同一对象的评分相似度确定的,其中,每个对象具有第一向量和第二向量,所述第一向量是所述对象在相应的历史标签上的词频/逆向文件频率值,所述第二向量是所述对象上的历史评分,所述对象间两两相似度的确定包括:根据所述第一向量之间的相似度确定所述内容相似度Sim1(i,j),所述i,j是对象;根据所述第二向量之间的相似度确定所述评分相似度Sim2(i,j);确定所述对象间两两相似度Sim(i,j)=Sim1(i,j)*a+Sim2(i,j)*(1-a),其中0<a<1,参数a用于调节权重。2.如权利要求1所述的方法,其中,根据预先确定的用户在不同评分等级下与历史标签的关联关系确定所述当前用户在所述当前评分下的历史标签作为所述候选标签集包括:确定K个对象,所述K个对象是根据所述对象间两两相似度所确定的与所述当前对象相似度最高,且所述当前用户使用过的标签;以该当前用户在该K个对象上使用过的标签作为所述候选标签集。3.如权利要求2所述的方法,其中,所述确定K个对象包括:进一步限制所述当前用户评分也为r。4.如权利要求2或3所述的方法,其中,所述指标值包括所述候选标签的权值其中,所述当前用户给第k个对象使用标签t,则vt=1,否则vt=0。5.根据权利要求1所述的方法,所述用户在不同评分下与历史标签的关联关系包括用户u在不同评分等级r下的标签生成概率p(t|u,r),所述指标值包括所述候选标签的生成概率。6.根据权利要求5所述的方法,还包括:确定标签属性分布p(Xt),所述标签属性Xt包括主观类和客观类;确定对象i在标签t上的分布p(t|i);确定所述其中,K是所述历史标签的主题z的数目,p(t|z)是所述主题z在所述历史标签上的分布,所述p(z|u,r)是用户u在不同评分等级r下在所述历史标签的主题z上的分布。7.如权利要求6所述的方法,其特征在于:根据所述标签属性分布p(Xt)确定每个所述候选标签是客观类标签的概率p(Xt=0),以及是主观类标签的概率p(Xt=1);根据公式p(Xt=0)*p(t|i)+p(Xt=1)*p(t|u,r)计算所述候选标签的生成概率。8.一种为用户推荐标签的装置,该装置包括:评分...

【专利技术属性】
技术研发人员:赵石顽包胜华袁泉吴贤
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1