基于公共文化知识图谱平台的综合推荐系统技术方案

技术编号:16128845 阅读:33 留言:0更新日期:2017-09-01 20:51
本发明专利技术涉及一种基于公共文化知识图谱平台的综合推荐系统,包括:标注单元,用于对提取到的资源分配资源标签,以及对提取到的用户数据分配用户兴趣标签;标签库,用于存储所述资源标签和用户兴趣标签;标签挖掘单元,用于对所述标签库中的标签进行挖掘分析;推荐单元,用于根据所述标签挖掘单元的挖掘分析结果做公共文化信息的综合推荐;可视化单元,用于对所述推荐单元的综合推荐结果进行可视化展示。本发明专利技术中,实现了跨领域、跨类别、跨数据结构、跨数据源的公共文化知识推荐。

Comprehensive recommendation system based on public cultural knowledge atlas platform

The invention relates to a comprehensive recommendation system, public culture platform based on knowledge map includes: mark unit for resource allocation of resources to the label on the extraction, and the extraction of the user data distribution user tag; tag library for storing the resource labels and user interest labels; labels for the mining unit. The tag library label in the analysis; recommendation unit for mining analysis unit do public cultural information comprehensive recommendation according to the label; visualization unit of a recommended comprehensive recommendation unit for visual display of results. The invention realizes the public cultural knowledge recommendation of cross field, cross category, cross data structure and cross data source.

【技术实现步骤摘要】
基于公共文化知识图谱平台的综合推荐系统
本专利技术属于文化大数据推荐系统领域和知识检索领域,具体涉及一种基于公共文化知识图谱平台的综合推荐系统。
技术介绍
推荐系统根据用户浏览网页时的点击行为以及对网上资源的兴趣特点,向用户推荐其感兴趣的相关信息。推荐系统是个复杂的系统工程,依赖用户数据、架构、算法、人机交互等环节的有机结合,需要统计学技术、数据挖掘技术、信息检索技术等学科的统一结合。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和混合推荐。随着互联网规模的不断扩大,文化领域资源的种类和数量也不断快速增长,用户有时需要花费大量的时间才能找到自己感兴趣的文化资源。这种浏览大量无关的信息和过程,无疑会使淹没在信息过载问题中的用户们不断流失。为了解决这些问题,基于公共数字文化的个性化推荐系统应运而生。公共数字化文化综合个性化推荐系统是建立在海量数据挖掘基础上的一种高级智能平台,以帮助用户的阅读浏览提供个性化的决策支持和信息服务。通过对文化资源,如视频,和用户兴趣特点的分析,推荐系统根据用户的个人兴趣和行为模型,设计出一个混合的个性化推荐系统。它包含了基于物品的协同过滤机制,基于内容的推荐,从用户行为中提炼出来的兴趣主题模型,以及根据用户反馈信息对推荐系统的优化等等。问题:当前大多数推荐系统,如基于内容的推荐、协同过滤、混合推荐等方法,聚焦在单一领域和单一类型的资源推荐上。推荐结果新颖性和多样化上有所不足,特别是当用户行为数据过少的时候,会出现冷启动和数据稀疏性问题,严重影响了推荐质量。新型的文化资源共享模式决定了文化信息的推荐技术具有以下需求,如图4所示:跨领域:在不同领域的文化资源或信息之间进行推荐,例如,用户浏览文学信息的时候,为他推荐相关的音乐和美术作品;跨类别:在不同类别的信息和资源之间进行推荐,比如小说“三国演义”跟诗词“临江仙·滚滚长江东逝水”属于不同的类别的文化信息,但是针对同一个主题;跨结构:面向文化的推荐技术需要在异构数据之间进行推荐,例如,用户浏览图片的时候推荐文本和视频;跨数据源:推荐来自不同的文化资源数据源和信息,例如,用户在浏览国博收藏品的时候,向他推荐上海博物馆的相关收藏品。
技术实现思路
为了解决现有技术中的上述问题,本专利技术提出了一种基于公共文化知识图谱平台的综合推荐系统,以实现跨领域、跨类别、跨结构、跨数据源的公共文化知识推荐。该系统包括:标注单元,用于对提取到的资源分配资源标签,以及对提取到的用户数据分配用户兴趣标签;标签库,用于存储所述资源标签和用户兴趣标签;标签挖掘单元,用于对所述标签库中的标签进行挖掘分析;推荐单元,用于根据所述标签挖掘单元的挖掘分析结果做公共文化信息的综合推荐;可视化单元,用于对所述推荐单元的综合推荐结果进行可视化展示。优选地,所述标注单元包括:资源标注模块,用于在公共文化资源库中提取元数据,利用资源标签提取方法和标签补全方法对所述元数据进行资源标注,分配资源标签;用户兴趣标注模块,用于在用户画像数据库中提取用户数据,利用基于知识挖掘的方法和基于机器学习的方法对所述用户数据进行标注,分配用户兴趣标签。优选地,所述标签库中维护有标签列表,所述标签列表为对所述标签库中所存储的资源标签和用户兴趣标签进行消重后得到的标签列表。优选地,所述推荐单元包括单项推荐模块和综合推荐模块,所述单项推荐模块具体包括资源推荐子模块、知识推荐子模块、标签推荐子模块和用户兴趣推荐子模块。优选地,所述资源推荐子模块,用于基于内容推荐方式和协同过滤方式,将公共文化资源库中所包含的公共文化资源进行推荐;所述知识推荐子模块,用于根据所述挖掘分析结果中所选择的资源标签做背景知识推荐;所述标签推荐子模块,用于根据所述挖掘分析结果中所选择的资源标签做相关资源标签推荐;所述用户兴趣推荐子模块,用于根据所述挖掘分析结果中用户的兴趣标签做对应的标签推荐。优选地,所述标签推荐子模块中的资源标签推荐为根据各资源标签的重要性为用户推荐资源标签,各资源标签的权重计算公式为:W资源=S资源关键词·E资源关键词(t)+S资源名·E资源名(t)+S资源描述·F资源描述(t)其中,W资源表示资源标签的权重,S资源关键词表示资源关键词的重要性,E资源关键词表示该资源标签是否包含在资源关键词中,S资源名表示资源名的重要性,E资源名表示该资源标签是否包含在资源名中,S资源描述表示资源的描述性内容的重要性,F资源描述表示描述性内容中出现该资源标签的次数,F值为归一化值;在E资源关键词和E资源名中,0表示未包含,1表示包含。优选地,所述用户兴趣推荐子模块中的兴趣标签推荐为根据用户的兴趣标签的重要性为用户推荐资源标签,各兴趣标签的权重计算公式为:W兴趣(t)=S人口特征·E人口特征(t)+S用户行为·B用户行为(t)+S用户收藏·F用户收藏(t)+S用户评论·C用户评论(t)其中,W兴趣表示兴趣标签的权重,S人口特征表示用户人口特征信息对于分析用户兴趣的重要性,E人口特征表示该标签是否包含在人口特征关键词中,0表示未包含,1表示包含,S用户行为表示用户行为对于分析用户兴趣的重要性,B用户行为表示多因素的用户行为加权函数,S用户收藏表示用户收藏的资源对于分析用户兴趣的重要性,F用户收藏表示用户收藏的资源中,该兴趣标签在资源标签组中出现的次数,S用户评论表示用户的评论对于分析用户兴趣的重要性,C用户评论表示兴趣标签的语义对于用户评论的语义描述的重要性。优选地,所述综合推荐模块为所述资源推荐子模块、知识推荐子模块、标签推荐子模块和用户兴趣推荐子模块中任意两种或两种以上组合。优选地,所述可视化单元具体为展示资源类表、知识卡片、公共文化机构的相关资源信息、标签图谱、用户兴趣标签云,具体包括图形用户界面模块和人机交互模块;所述图形用户界面模块为展示HTML5技术编辑的内容、图片内容、视频内容;所述人机交互模块为管理可视化模型的布局、可视化模型的交互、以及通过交互式的选择方法,对高维数据进行维度过滤。优选地,所述系统还包括推荐结果库,所述推荐结果库中存储有推荐资源序列、推荐的聚合知识、推荐的资源信息、推荐的加权标签及其关系。与现有技术相比,本专利技术至少具有以下优点:通过本专利技术中基于公共文化知识图谱平台的综合推荐系统设计,实现了跨领域、跨类别、跨结构、跨数据源的公共文化知识推荐。附图说明图1为本专利技术所提供的综合推荐系统的工作流程示意图;图2为本专利技术所提供的综合推荐系统的系统架构示意图;图3为本专利技术所提供的综合推荐系统的应用实例示意图。图4为文化推荐概念:跨领域、跨类别、跨数据结构、跨数据源。具体实施方式下面参照附图来描述本专利技术的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本专利技术的技术原理,并非旨在限制本专利技术的保护范围。在专利“公共文化知识图谱平台及其使用方法”中,公开了一种公共文化知识图谱平台,主要用于从海量的公共文化数据中抽取知识和构建知识图谱,并提供知识图谱挖掘。公共文化知识图谱平台提供了知识推理、知识挖掘的功能。推荐系统的多样性描述了推荐列表中物品两两之间的不相似性,将多样性细分本文档来自技高网
...
基于公共文化知识图谱平台的综合推荐系统

【技术保护点】
一种基于公共文化知识图谱平台的综合推荐系统,其特征在于,包括:标注单元,用于对提取到的资源分配资源标签,以及对提取到的用户数据分配用户兴趣标签;标签库,用于存储所述资源标签和用户兴趣标签;标签挖掘单元,用于对所述标签库中的标签进行挖掘分析;推荐单元,用于根据所述标签挖掘单元的挖掘分析结果做公共文化信息的综合推荐;可视化单元,用于对所述推荐单元的综合推荐结果进行可视化展示。

【技术特征摘要】
1.一种基于公共文化知识图谱平台的综合推荐系统,其特征在于,包括:标注单元,用于对提取到的资源分配资源标签,以及对提取到的用户数据分配用户兴趣标签;标签库,用于存储所述资源标签和用户兴趣标签;标签挖掘单元,用于对所述标签库中的标签进行挖掘分析;推荐单元,用于根据所述标签挖掘单元的挖掘分析结果做公共文化信息的综合推荐;可视化单元,用于对所述推荐单元的综合推荐结果进行可视化展示。2.根据权利要求1所述的基于公共文化知识图谱平台的综合推荐系统,其特征在于,所述标注单元包括:资源标注模块,用于在公共文化资源库中提取元数据,利用资源标签提取方法和标签补全方法对所述元数据进行资源标注,分配资源标签;用户兴趣标注模块,用于在用户画像数据库中提取用户数据,利用基于知识挖掘的方法和基于机器学习的方法对所述用户数据进行标注,分配用户兴趣标签。3.根据权利要求1所述的基于公共文化知识图谱平台的综合推荐系统,其特征在于,所述标签库中维护有标签列表,所述标签列表为对所述标签库中所存储的资源标签和用户兴趣标签进行消重后得到的标签列表。4.根据权利要求1所述的基于公共文化知识图谱平台的综合推荐系统,其特征在于,所述推荐单元包括单项推荐模块和综合推荐模块,所述单项推荐模块具体包括资源推荐子模块、知识推荐子模块、标签推荐子模块和用户兴趣推荐子模块。5.根据权利要求4所述的基于公共文化知识图谱平台的综合推荐系统,其特征在于,所述资源推荐子模块,用于基于内容推荐方式和协同过滤方式,将公共文化资源库中所包含的公共文化资源进行推荐;所述知识推荐子模块,用于根据所述挖掘分析结果中所选择的资源标签做背景知识推荐;所述标签推荐子模块,用于根据所述挖掘分析结果中所选择的资源标签做相关资源标签推荐;所述用户兴趣推荐子模块,用于根据所述挖掘分析结果中用户的兴趣标签做对应的标签推荐。6.根据权利要求5所述的基于公共文化知识图谱平台的综合推荐系统,其特征在于,所述标签推荐子模块中的资源标签推荐为根据各资源标签的重要性为用户推荐资源标签,各资源标签的权重计算公式为:W资源=S资源关键词·E资源关键词(t)+S资源名·E资源名(t)+S资源描述·F资源描述(t)其中,W资源表示资源标签的权重,S资源关键词表示资源关...

【专利技术属性】
技术研发人员:王健张桂刚杨颐黄卫星
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1