一种基于大数据的影视作品市场分析方法技术

技术编号：18289605 阅读：71 留言：0更新日期：2018-06-24 04:21

本发明专利技术涉及一种基于大数据的影视作品市场分析方法,包括如下步骤：从社交网站获取数据；进行K‑Means聚类剔除异常数据；剔除异常数据的数据，构建一个分析流，进行多次K‑Means聚类和设置分箱节点对影片评分和观影人群进行分析后将数据存入目标文件。在进行步骤从社交网站获取数据之前，定义需要的观影评论数据指标。剔除异常值，对数据进行一次K‑Means聚类，将剔除异常数据的数据构建一个分析流，用K‑Means聚类算法或分层聚类演算法进行聚类处理，并设置分箱节点对数据按观影人群年龄和评分分级后将数据存入目标文件。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大数据的影视作品市场分析方法
本专利技术属于数据挖掘
，具体涉及一种基于大数据的影视作品市场分析方法。
技术介绍
传统的数据分析方法和软件无法进行获取、加工和清洗的数据我们可以称之为大数据。大数据应用的关键在于数据获取变得更加便捷，数据仓库技术，可视化的分析结果。大数据犹如没有开发的“金矿”，可以开发和利用这些大数据为影视作品的投资决策提供数据支撑，运用在影视行业。近年来，大数据在各行各业引领浪潮，成为重要的生产要素，在影视作品的生产过程中，需要大数据驱动创新，节目受众需求多样化需要大数据分析。
技术实现思路
本专利技术的目的在于，针对上述现有技术的问题，提供设计一种基于大数据的影视作品市场分析方法，以解决上述技术问题。为了达到上述目的，本专利技术的技术方案是：一种基于大数据的影视作品市场分析方法，包括如下步骤：从社交网站获取数据；进行K-Means聚类剔除异常数据；剔除异常数据的数据，构建一个分析流，进行多次K-Means聚类和设置分箱节点对影片评分和观影人群进行分析后将数据存入目标文件。进一步的，在进行步骤从社交网站获取数据之前，定义需要的观影评论数据指标。进一步的，所述数据指标包括影片评价得分均值，影片被网友评分次数，评分网友平均年龄，评分网友性别分布，评论该影片的网友的评分次数的均值，评价该影片的网友所有评分得分均值的均值。进一步的，从社交网站获取数据还包括利用python提取与设定数据指标匹配的字段，并存入ORACLE数据库管理系统。进一步的，步骤利用python提取与设定数据指标匹配的字段，并存入ORACLE数据库管理系统还包括：将提...
一种基于大数据的影视作品市场分析方法

【技术保护点】
1.一种基于大数据的影视作品市场分析方法,其特征在于包括如下步骤：从社交网站获取数据；进行K‑Means聚类剔除异常数据；剔除异常数据的数据，构建一个分析流，进行多次K‑Means聚类和设置分箱节点对影片评分和观影人群进行分析后将数据存入目标文件。

【技术特征摘要】
1.一种基于大数据的影视作品市场分析方法,其特征在于包括如下步骤：从社交网站获取数据；进行K-Means聚类剔除异常数据；剔除异常数据的数据，构建一个分析流，进行多次K-Means聚类和设置分箱节点对影片评分和观影人群进行分析后将数据存入目标文件。2.根据权利要求1所述的一种基于大数据的影视作品市场分析系统,其特征在于,在进行步骤从社交网站获取数据之前，定义需要的观影评论数据指标。3.根据权利要求2所述的一种基于大数据的影视作品市场分析方法,其特征在于,所述数据指标包括影片评价得分均值，影片被网友评分次数，评分网友平均年龄，评分网友性别分布，评论该影片的网友的评分次数的均值，评价该影片的网友所有评分得分均值的均值。4.根据权利要求3所述的一种基于大数据的影视作品市场分析方法,其特征在于,从社交网站获取数据还包括利用python提取与设定数据指标匹配的字段，并存入ORACLE数据库管理系统。5.根据权利要求4所述的一种基于大数据的影视作品市场分析方法,其特征在于,步骤利用python提取与设定数据指标匹配的字段，并存入ORACLE数据库管理系统还包括：将提取的与设定的数据指标匹配...

【专利技术属性】
技术研发人员：王莹，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人