信息处理装置和方法制造方法及图纸

技术编号:2836831 阅读:205 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种信息处理装置、信息处理方法和程序,它们能够通过CF方法抑制推荐集中于内容的一部分,并且向具有少量历史信息的用户推荐内容。步骤S11检测向其推荐乐曲的用户A和具有最相似历史信息的另一用户X。步骤S12检测用户X拥有而用户A不拥有的乐曲。步骤S13识别每个集群层中乐曲“a”所属的集群。步骤S14提取被分类到全部所识别的集群的共同乐曲作为推荐候选。此外,步骤S15在推荐候选中选择与乐曲“a”具有最相似的集群信息的一个乐曲。将由此选择的乐曲推荐给用户A。例如,本发明专利技术可应用于在因特网上构建的内容销售站点。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种信息处理装置、信息处理方法和程序,尤其涉及一种将内容分类成集群(cluster)、使用将内容分类成的集群管理内容特征、并在检索或推荐内容时使用该内容特征的信息处理装置、信息处理方法和程序。
技术介绍
传统上,已经提出了一种用于基于用户的偏好检索和推荐电视节目和乐曲等内容(所谓的内容个性化)的专利技术(例如,参见专利文献1)。对于内容个性化,普遍使用被称为协作过滤(collaborativefiltering,CF)的方法和被称为基于内容过滤(content-basedfiltering,CBF)的方法。CF方法管理每个用户的购买历史,当向用户A推荐内容时,检测与用户A具有相似购买历史的其他用户X,并推荐其他用户X已购买而用户A未购买的内容。例如,因特网上的邮购销售站点采用CF方法。CBF方法在提取偏好和推荐内容中直接使用由分发端或销售端预先给予内容的元数据。具体来说,计算表示用户偏好的特征矢量与作为候选的每个乐曲的特征矢量之间的距离(余弦相关等),并推荐计算出的距离短的乐曲作为适合于该用户偏好的乐曲。日本特开2004-194107号公报
技术实现思路
本专利技术要解决的问题上述CF方法有以下不便(1)不能将没有用户购买的内容推荐给任何用户。因此,内容的推荐集中在已准备的大量内容中的一部分,而其余的大多数内容没有被推荐。(2)当向新用户推荐内容时,有关该用户的购买历史的信息很少。因此,不能检测到具有相似历史信息的其他用户,因而不能推荐内容(所谓的冷开始问题)。(3)通常,内容的数量和用户的数量在增加。在这种情况下,检测具有相似历史信息的其他用户时的操作量也增加,使得不能快速确定要推荐的内容。鉴于以上考虑做出本专利技术,本专利技术防止了CF方法中推荐集中于内容的一部分,并向具有很少历史信息的用户推荐内容。用于解决问题的手段根据本专利技术的一个方面,提供一种用于从一组内容中选择满足预定条件的内容并将该内容呈现给用户的信息处理装置,该信息处理装置包括内容分类部件,用于将形成该组内容的每个内容分类成与该内容的元数据相对应的每层中的多个第一集群中的一个;保持部件,用于保持表示每个内容与每个内容分类到的层中的第一集群之间的对应关系的数据库;管理部件,用于管理关于用户的内容的历史信息;选择部件,用于基于历史信息识别感兴趣的第一集群,并选择被分类到所识别的第一集群的内容;以及呈现部件,用于呈现所选择的内容。选择部件可以包括检测部件,用于检测具有与第一用户的历史信息相似的历史信息的第二用户;识别部件,用于识别第一用户的历史信息中不存在而第二用户的历史信息中存在的内容被分类到的第一集群;以及提取部件,用于提取被分类到所识别的第一集群的内容;以及呈现部件可以向第一用户呈现所提取的内容。根据本专利技术的一个方面的信息处理装置还包括生成部件,用于基于用户历史信息和数据库,以第一集群为单位生成表示用户偏好的偏好信息;以及分组部件,用于基于偏好信息对用户进行分组;其中,选择部件可以包括检测部件,用于检测与第一用户属于同一组的第二用户;识别部件,用于识别第一用户的历史信息中不存在而第二用户的历史信息中存在的内容被分类到第一集群;以及提取部件,用于提取被分类到所识别的第一集群的内容;以及呈现部件可以向第一用户呈现所提取的内容。根据本专利技术的一个方面的信息处理装置还包括生成部件,用于基于用户历史信息和数据库,以第一集群为单位生成表示用户偏好的偏好信息;其中,选择部件可以包括检测部件,用于检测具有由偏好信息所表示的与第一用户的偏好相似的偏好的第二用户;识别部件,用于基于第一用户的偏好信息和第二用户的偏好信息,识别感兴趣的第一集群;以及提取部件,用于提取被分类到所识别的第一集群的内容;以及呈现部件可以向第一用户呈现所提取的内容。检测部件可以包括标准化部件,用于将用户的偏好信息标准化;权重计算部件,用于根据每个用户标准化后的偏好信息计算针对每个用户每层的权重;以及相似程度计算部件,用于根据每层的权重和偏好信息,计算表示用户中的第一用户和用户中的其他用户之间的偏好相似程度的相似程度;以及根据所计算出的相似程度检测具有与第一用户的偏好相似的偏好的第二用户。根据本专利技术的一个方面的信息处理装置还可以包括生成部件,用于基于用户历史信息和数据库,以第一集群为单位生成表示用户偏好的偏好信息;以及分组部件,用于基于偏好信息对用户进行分组;其中,选择部件可以包括检测部件,用于检测与第一用户属于同一组的第二用户;识别部件,用于基于第一用户的偏好信息和第二用户的偏好信息,识别感兴趣的第一集群;以及提取部件,用于提取被分类到所识别的第一集群的内容;并且呈现部件可以向第一用户呈现所提取的内容。根据本专利技术的一个方面的信息处理装置还可以包括设置部件,用于对通过内容分类部件将元数据分类到的每一第一集群设置关键词;以及生成部件,用于生成表示使用通过设置部件所设置的关键词呈现内容的原因的原因文本;其中,呈现部件还可以呈现该原因文本。该信息处理装置还可以包括元数据分类部件,该元数据分类部件用于将内容的元数据分类到多个第二集群中的一个,并将层分配到第二集群;其中,内容分类部件将每个内容分类到每个所分配的层中的多个第一集群中的一个。该信息处理装置还包括生成部件,用于基于用户历史信息和数据库,以第一集群为单位生成表示用户偏好的偏好信息;其中,选择部件可以选择被分类到全部层中的全部第一集群当中由偏好信息表示的最大数量的第一集群的内容。根据本专利技术的一个方面,提供了一种用于从一组内容选择满足预定条件的内容并将该内容呈现给用户的信息处理装置的信息处理方法,该信息处理方法包括以下步骤将形成该组内容的每个内容分类到与该内容的元数据相对应的每层中的多个集群中的一个;保持表示每个内容与将每个内容分类到的层中的集群之间的对应关系的数据库;管理关于用户的内容的历史信息;基于历史信息识别感兴趣的集群,并选择被分类成所识别的集群的内容;以及呈现所选择的内容。根据本专利技术的一个方面,提供了一种用于从一组内容选择满足预定条件的内容并向用户推荐该内容的程序,该程序使计算机进行包括以下步骤的处理将形成该组内容的每个内容分类到与该内容的元数据相对应的每层中的多个集群中的一个;保持表示每个内容与将每个内容分类到的层中的集群之间的对应关系的数据库;管理关于用户的内容的历史信息;基于历史信息识别感兴趣的集群,并选择被分类到所识别的集群的内容;以及呈现所选择的内容。本专利技术的一方面,将形成该组内容的每个内容分类成到与该内容的元数据相对应的每层中的多个集群中的一个。然后,保持表示每个内容与每个内容被分类到的层中的集群之间的对应关系的数据库。另外,管理关于用户的内容的历史信息。然后,基于历史信息识别感兴趣的集群,选择被分类到所识别的集群的内容,并呈现所选择的内容。如上所述,根据本专利技术的一方面,可以通过CF方法向用户推荐内容。另外,根据本专利技术的一方面,可以防止推荐集中于全部内容的一部分。而且,根据本专利技术的一方面,甚至可以向具有少量历史信息的用户推荐内容。附图说明图1是示出应用本专利技术的推荐系统的结构的例子的框图。图2是表示将乐曲的元数据分类成的集群和集群层的概念的图。图3是示出乐曲-集群对应表的例子的图。图4是示出集群-乐曲对应表的例本文档来自技高网...

【技术保护点】
一种信息处理装置,用于从一组内容中选择满足预定条件的内容并将该内容呈现给用户,所述信息处理装置包括:内容分类部件,用于将形成所述一组内容的每个内容分类到与所述内容的元数据相对应的每层中的多个第一集群中的一个;保持部件,用于保 持表示每个内容与每个内容分类到的所述层中所述第一集群之间的对应关系的数据库;管理部件,用于管理关于所述用户的内容的历史信息;选择部件,用于基于所述历史信息来识别感兴趣的第一集群,并选择被分类到所识别的所述第一集群的内容;以及 呈现部件,用于呈现所选择的所述内容。

【技术特征摘要】
【国外来华专利技术】JP 2005-9-28 281357/2005;JP 2006-5-31 151012/20061.一种信息处理装置,用于从一组内容中选择满足预定条件的内容并将该内容呈现给用户,所述信息处理装置包括内容分类部件,用于将形成所述一组内容的每个内容分类到与所述内容的元数据相对应的每层中的多个第一集群中的一个;保持部件,用于保持表示每个内容与每个内容分类到的所述层中所述第一集群之间的对应关系的数据库;管理部件,用于管理关于所述用户的内容的历史信息;选择部件,用于基于所述历史信息来识别感兴趣的第一集群,并选择被分类到所识别的所述第一集群的内容;以及呈现部件,用于呈现所选择的所述内容。2.根据权利要求1所述的信息处理装置,其特征在于,所述选择部件包括检测部件,用于检测具有与第一用户的所述历史信息相似的所述历史信息的第二用户;识别部件,用于识别所述第一用户的所述历史信息中不存在而所述第二用户的所述历史信息中存在的内容被分类到的第一集群;以及提取部件,用于提取被分类到所识别的所述第一集群的内容;以及所述呈现部件将所提取的所述内容呈现给所述第一用户。3.根据权利要求1所述的信息处理装置,其特征在于,还包括生成部件,用于基于用户的所述历史信息和所述数据库,以所述第一集群为单位生成表示所述用户的偏好的偏好信息;以及分组部件,用于基于所述偏好信息对用户进行分组;其中,所述选择部件包括检测部件,用于检测与第一用户属于同一组的第二用户;识别部件,用于识别所述第一用户的所述历史信息中不存在而所述第二用户的所述历史信息中存在的内容被分类到的第一集群;以及提取部件,用于提取被分类到所识别的所述第一集群的内容;以及所述呈现部件将所提取的所述内容呈现给所述第一用户。4.根据权利要求1所述的信息处理装置,其特征在于,还包括生成部件,用于基于所述用户的所述历史信息和所述数据库,以所述第一集群为单位生成表示所述用户的偏好的偏好信息;其中,所述选择部件包括检测部件,用于检测具有由所述偏好信息表示的与第一用户的偏好相似的偏好的第二用户;识别部件,用于基于所述第一用户的偏好信息和所述第二用户的偏好信息来识别感兴趣的第一集群;以及提取部件,用于提取被分类到所识别的所述第一集群的内容;以及所述呈现部件将所提取的所述内容呈现给所述第一用户。5.根据权利要求4所述的信息处理装置,其特征在于,所述检测部件包括标准化部件,用于将用户的偏好信息标准化;权重计算部件,用于根据每个用户的标准化后的偏好信息来计算针对每个用户每层的权重;以及相似程度计算部件,用于根据每层的权重和所述偏好信...

【专利技术属性】
技术研发人员:山本则行馆野启斋藤真里角田智弘宫嵜充弘
申请(专利权)人:索尼株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1