一种出版物发行分析系统和方法技术方案

技术编号：15792136 阅读：43 留言：0更新日期：2017-07-09 23:28

本发明专利技术实施例公开了一种出版物发行分析系统和方法。其中，所述系统包括：数据采集子系统，用于获取出版物关联的互联网爬虫数据和/或地面销售数据；清洗层，用于对获取的数据进行清洗，得到原始数据；数据层，用于存储所述原始数据；处理层，用于读取所述数据层的原始数据，对所述原始数据进行调度和挖掘分析，得到基础分析数据；应用分析子系统，用于根据所述基础分析数据得到出版发行分析结果数据；展现层，用于根据所述出版发行分析结果数据展现分析结果。本发明专利技术实施例提供的技术方案，依托海量的互联网数据和/或地面销售数据，采用大数据处理，为出版发行提供了精确、可靠的分析结果，为出版发行提供了精确和有效的决策信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种出版物发行分析系统和方法
本专利技术实施例涉及出版发行
，尤其涉及种一种出版物发行分析系统和方法。
技术介绍
随着互联网行业的日益发展，传统出版行业正逐步与互联网接轨。在过去信息量贫乏和渠道单一的时代，出版物的发行和销售一直都处于监控难，信息收集慢的境况。而对于出版发行后的市场反馈信息，更是稀疏不齐。在信息爆炸时代，读者消费出版产品呈现“碎片化”和“瞬变化”特征。图书选题，一直是出版社工作决策的关键一步。及时了解时下热点议题，悉知大众最新的阅读期待和阅读需求，洞见热点图书选题的发展趋势和分布，是出版单位对数据支撑系统的普遍需求。然而现有出版行业信息化程度高，自动化程度低。缺少对出版物发行分析的有效方法，无法为出版发行提供有效的决策信息。
技术实现思路
本专利技术提供一种出版物发行分析系统和方法，以对海量数据进行分析和挖掘，为出版发行提供精确和有效的决策信息。第一方面，本专利技术实施例提供了一种出版物发行分析系统，该系统包括：数据采集子系统，用于获取出版物关联的互联网爬虫数据和/或地面销售数据；清洗层，用于对获取的数据进行清洗，得到原始数据；数据层，用于存储所述原始数据；处理层，用于读取所述数据层的原始数据，对所述原始数据进行调度和挖掘分析，得到基础分析数据；应用分析子系统，用于根据所述基础分析数据得到出版发行分析结果数据；展现层，用于根据所述出版发行分析结果数据展现分析结果。第二方面，本专利技术实施例还提供了一种出版物发行分析方法，该方法包括：获取出版物关联的互联网爬虫数据和/或地面销售数据；对获取的数据进行清洗，得到原始数据；存储所述原始数据；读取...
一种出版物发行分析系统和方法

【技术保护点】
一种出版物发行分析系统，其特征在于，包括：数据采集子系统，用于获取出版物关联的互联网爬虫数据和/或地面销售数据；清洗层，用于对获取的数据进行清洗，得到原始数据；数据层，用于存储所述原始数据；处理层，用于读取所述数据层的原始数据，对所述原始数据进行调度和挖掘分析，得到基础分析数据；应用分析子系统，用于根据所述基础分析数据得到出版发行分析结果数据；展现层，用于根据所述出版发行分析结果数据展现分析结果。

【技术特征摘要】
1.一种出版物发行分析系统，其特征在于，包括：数据采集子系统，用于获取出版物关联的互联网爬虫数据和/或地面销售数据；清洗层，用于对获取的数据进行清洗，得到原始数据；数据层，用于存储所述原始数据；处理层，用于读取所述数据层的原始数据，对所述原始数据进行调度和挖掘分析，得到基础分析数据；应用分析子系统，用于根据所述基础分析数据得到出版发行分析结果数据；展现层，用于根据所述出版发行分析结果数据展现分析结果。2.根据权利要求1所述的系统，其特征在于，所述数据采集子系统具体用于：爬取与出版物关联的门户网站数据、论坛数据、微博数据、微信数据和第三方数据中的至少一种数据；获取出版物关联的地面销售数据。3.根据权利要求1所述的系统，其特征在于，所述处理层包括：任务调度引擎，用于对所述原始数据进行周期调度处理得到周期数据；数据挖据引擎，用于对所述周期数据的内容进行归类、中文分词、词性标注和语义分析处理,得到挖掘结果数据；其中，所述周期性数据包括销售数据、评论数据、媒体热点数据、畅销榜单数据、作家影响力数据和读者反馈相关数据；所述应用分析子系统用于对所述周期数据、所述挖掘结果数据和/或所述原始数据进行实时分析、固定分析和智能分析，生成选题推荐相关数据、出版物营销相关数据、出版物反馈相关数据和出版市场相关数据中的至少一类数据。4.根据权利要求3所述的系统，其特征在于，所述数据挖掘引擎还用于：根据用户的配置和输入的信息，对存储的数据进行抽取、聚合和分类，生成挖掘结果数据。5.根据权利要求3或4所述的系统，其特征在于，所述展现层包括：出版市场监测子系统，用于根据所述出版市场相关数据展现出版社信息、行业政策信息、定向关注信息和预警信息中的至少一种信息；选题支撑子系统，用于根据所述选题推荐相关数据展现畅销书排行与分析信息、网络文学排行与分析信息、选题排行与分析信息、作者排行与分析信息、以及图书查重信息中的至少一种信息；营销决策支撑子系统，用于根据所述出版物营销相关数据展现出版物检索定位信息、读者特征分析信息、营销渠道分析信息和市场分析信息中的至少一种信息；出版物反馈分析子系统，用于根据所述出版物反馈相关数据展现大众反馈分析信息、网络媒体反馈分析信息和专家名人反馈分析信...

【专利技术属性】
技术研发人员：蒲庆宇，杨进国，王曦，刘伯良，陈方云，
申请(专利权)人：天闻数媒科技北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人