一种多元属性电影数据可视化系统技术方案

技术编号:13899958 阅读:160 留言:0更新日期:2016-10-25 14:06
本发明专利技术提供了一种多元属性电影数据可视化系统,包括:数据预处理模块,根据原始项目集中电影项目自身的多元属性及用户标签对电影项目数据进行预处理,以产生用于进行可视化映射的输入数据;可视化映射模块,根据输入数据生成电影项目可视化界面。本发明专利技术解决了推荐系统的新用户冷启动问题,并增加了系统的透明度和交互性,提高推荐系统的准确性和用户满意度。

【技术实现步骤摘要】

本专利技术属于数据处理
,具体地说,尤其涉及一种多元属性电影数据可视化系统
技术介绍
电影个性化推荐系统是从庞杂的电影项目集中选择用户可能感兴趣的电影推荐给相应用户,用户可能感兴趣的项目是通过用户资料中的对看过电影的历史评分数据计算得出的。但是,新用户加入进来时,其资料中并没有项目偏好信息,所以无法针对其进行个性化的推荐,这就是所谓的新用户冷启动问题。但是,现有推荐系统对新用户的冷启动问题的解决,仅仅是从算法的优化上来考虑(如人口统计学算法、推荐热门项目等),并没有从数据产生的源头来解决问题。
技术实现思路
为解决以上问题,本专利技术提供了一种多元属性电影数据可视化系统,用于从数据产生的源头来解决推荐系统对新用户的冷启动问题。根据本专利技术的一个实施例,提供了一种多元属性电影数据可视化系统,包括:数据预处理模块,根据原始项目集中电影项目自身的多元属性及用户标签对电影项目数据进行预处理,以产生用于进行可视化映射的输入数据;可视化映射模块,根据所述输入数据生成电影项目可视化界面。根据本专利技术的一个实施例,所述数据预处理模块通过以下方式产生可视化的映射输入数据:根据每个电影项目的用户标签计算电影项目之间的皮尔逊相关系数,并根据皮尔逊相关系数计算电影项目节点之间连接边的权重值;将权重值作为电影项目连接边的附属属性,将流派、标题、海报和评分作为电影节点附属属性,生成第一数据文件;将导演名字和演员名字分别作为节点,通过名字属性生成第二数据文件。根据本专利技术的一个实施例,所述可视化映射模块进一步包括:流派控制单元,根据流派属性对电影项目分类,并控制流派分类面板显示于可视化界面以使得用户进行流派分类选择;主视图显示控制单元,根据流派控制单元对电影项目的分类以及第一数据文件,采用力导向算法生成电影项目主视图;副视图显示控制单元,根据流派控制单元对电影项目的分类以及第二数据文件,采用力导向算法生成导演-演员副视图。根据本专利技术的一个实施例,在所述主视图中,电影名称设为节点,节点颜色饱和度和透明度映射电影评分,其中,电影评分越高,对应节点颜色越深,透明度越低,皮尔逊相关系数设为电影名称之间的连接边,皮尔逊相关系数越大,两节点的相似度越高,连接边权重越大,连接边越粗;在所述副视图中,导演名字和演员名字设为节点,导演节点和演员节点通过不同颜色区分,节点之间的连接边表示导演和演员的合作关系。根据本专利技术的一个实施例,所述可视化映射模块进一步包括:节点交互控制单元,用于选定、调整及控制显示所述主视图和所述副视图,以使得用户对所述主视图和所述副视图进行节点控制。根据本专利技术的一个实施例,所述可视化映射模块进一步包括:力导向参数调节单元,用于对显示主视图及副视图中采用的力导向算法对应的参数进行设置,并控制力导向参数调节面板显示于可视化界面以使得用户进行力导向参数设置。根据本专利技术的一个实施例,所述可视化映射模块进一步包括:节点可见性调节单元,根据用户兴趣度对主视图和副视图中节点进行选择性可见调节,并控制节点可见性调节面板显示于可视化界面以使得用户进行节点可见性调节。根据本专利技术的一个实施例,在所述主视图中,所述用户兴趣度设置为距选定
焦点节点的路径距离,其中,通过设置节点可见性调节单元中的滑动距离滑动条,将超出选定焦点节点预设路径距离的节点隐藏。根据本专利技术的一个实施例,在所述副视图中,通过设置节点可见性调节单元中的滑动层级滑动条,将导演和演员分层显示。根据本专利技术的一个实施例,所述可视化映射模块进一步包括:电影评分交互单元,用于接收用户电影评分及输出评分作为用户资料数据,并且控制电影评分交互面板显示于可视化界面以使得用户进行电影评分及提交。本专利技术的有益效果:本专利技术将信息可视化技术与推荐系统结合起来,使用多元属性网络可视化技术对推荐系统的电影项目集进行可视化,尽量多地将有用的属性进行可视化映射,方便新用户全面浏览项目集。同时我系统加入了多种用户交互方法,允许用户对感兴趣的项目进行评分操作,并采集评分的数据输出,作为冷启动推荐系统的新用户输入数据。这样从数据来源上解决了推荐系统的新用户冷启动问题,并增加了系统的透明度和交互性,进而提高推荐系统的准确性和用户满意度。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要的附图做简单的介绍:图1是根据本专利技术的一个实施例的一种多元属性电影数据可视化系统结构图;图2是对应图1的所示系统的数据处理流程图;图3是根据本专利技术的一个实施例的数据预处理过程示意图;图4是根据本专利技术的一个实施例的可视化界面示意图;图5是根据本专利技术的一个实施例的可视化界面主视图;图6是根据本专利技术的一个实施例的可视化界面副视图;图7a是根据本专利技术的一个实施例的过滤出距离焦点三步的电影节点示意图;图7b是根据本专利技术的一个实施例的过滤出距离焦点二步的电影节点示意图;图7c是根据本专利技术的一个实施例的过滤出距离焦点一步的电影节点示意图;图8a是根据本专利技术的一个实施例的导演为焦点的一层副视图;图8b是根据本专利技术的一个实施例的导演为焦点的二层副视图;图8c是根据本专利技术的一个实施例的演员为焦点的一层副视图;图8d是根据本专利技术的一个实施例的演员为焦点的二层副视图;图9是根据本专利技术的一个实施例的电影评分面板示意图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。个性化推荐系统大多是针对现实生活中的数据进行推荐,其中大部分数据都具有关联的属性,如社交网络、生化网络和软件网络等。推荐项目集中除了数据间的彼此关联关系外,数据本身也包含多种属性。传统单一的可视化方法只能展示数据的单一属性,多种属性同时展示时视图会变得混乱和复杂。因此,针对推荐数据集的多种属性和数据间的关系连接,利用多元属性可视化技术对数据集进行可视化,并加入多种用户交互技术,使用户能够亲自选择感兴趣的项目,并对项目进行评分,并输出用户的交互数据作为推荐算法的输入。这样,就解决了冷启动问题中的新用户没有资料数据的问题,而且可以使用户对自己的偏好数据进行修改订正,有利于提高推荐系统的准确度和用户满意度。如图1所示为根据本专利技术的一个实施例的一种多元属性电影数据可视化系统结构图,图2所示为对应图1所示系统的数据处理流程图,以下参考图1和图2来对本专利技术进行详细说明。如图1所示,该多元属性电影数据可视化系统包括数据预处理模块和可视化映射模块,其中,数据预处理模块根据原始项目集中电影项目自身的多元属性及用户标签对电影项目数据进行预处理,以产生用于进行可视化映射的输入数据;可视化映射模块与数据预处理模块连接,根据输入数据生成电影项目可视化界面。由于每个电影项目都对应有电影名、导演、演员、流派、标签、评分、海报
等属性,每个电影项目都对应着由用户标注的本文档来自技高网
...

【技术保护点】
一种多元属性电影数据可视化系统,包括:数据预处理模块,根据原始项目集中电影项目自身的多元属性及用户标签对电影项目数据进行预处理,以产生用于进行可视化映射的输入数据;可视化映射模块,根据所述输入数据生成电影项目可视化界面。

【技术特征摘要】
1.一种多元属性电影数据可视化系统,包括:数据预处理模块,根据原始项目集中电影项目自身的多元属性及用户标签对电影项目数据进行预处理,以产生用于进行可视化映射的输入数据;可视化映射模块,根据所述输入数据生成电影项目可视化界面。2.根据权利要求1所述的系统,其特征在于,所述数据预处理模块通过以下方式产生可视化的映射输入数据:根据每个电影项目的用户标签计算电影项目之间的皮尔逊相关系数,并根据皮尔逊相关系数计算电影项目节点之间连接边的权重值;将权重值作为电影项目连接边的附属属性,将流派、标题、海报和评分作为电影节点附属属性,生成第一数据文件;将导演名字和演员名字分别作为节点,通过名字属性生成第二数据文件。3.根据权利要求2所述的系统,其特征在于,所述可视化映射模块进一步包括:流派控制单元,根据流派属性对电影项目分类,并控制流派分类面板显示于可视化界面以使得用户进行流派分类选择;主视图显示控制单元,根据流派控制单元对电影项目的分类以及第一数据文件,采用力导向算法生成电影项目主视图;副视图显示控制单元,根据流派控制单元对电影项目的分类以及第二数据文件,采用力导向算法生成导演-演员副视图。4.根据权利要求3所述的系统,其特征在于,在所述主视图中,电影名称设为节点,节点颜色饱和度和透明度映射电影评分,其中,电影评分越高,对应节点颜色越深,透明度越低,皮尔逊相关系数设为电影名称之间的连接边,皮尔逊相关系数越大,两节点的相似度越高,连接边权重越大,连接边越粗;在所述副视图中,导演名字和演员名字设为...

【专利技术属性】
技术研发人员:杨成李晨潜冬
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1