基于消费者行为的舆情监控系统技术方案

技术编号:20916715 阅读:72 留言:0更新日期:2019-04-20 09:43
本发明专利技术涉及一种基于消费者行为的舆情监控系统,该系统包括:爬虫模块,包括用于向各电商平台爬取消费者行为数据的网络爬虫,以及用于向互联网爬取热点新闻的网络爬虫;数据库,用于存储网络爬虫从电商平台爬取的消费者行为数据;数据分类模块,用于将消费者行为数据进行分类统计,并将统计结果发送给舆情分析服务器;舆情分析服务器;用于接收网络爬虫爬取到的热点新闻和数据分类模块发来的消费者行为数据,并从消费者行为数据中提取与热点新闻相匹配或相关联的信息,并作出指导性的舆情分析结果。

Public Opinion Monitoring System Based on Consumer Behavior

The invention relates to a public opinion monitoring system based on consumer behavior, which includes: a crawler module, including a network crawler for crawling consumer behavior data to various e-commerce platforms, and a network crawler for crawling hot news to the Internet; a database for storing consumer behavior data crawled by network crawlers from e-commerce platforms; and a data classification module for crawling consumer behavior data from e-commerce platforms. Consumer behavior data is classified and counted, and the statistical results are sent to public opinion analysis server; public opinion analysis server; used to receive consumer behavior data from hot news and data classification module crawled by network crawlers, and extract information matching or associated with hot news from consumer behavior data, and make guiding public opinion analysis results.

【技术实现步骤摘要】
基于消费者行为的舆情监控系统
本专利技术涉及舆情监控领域,具体涉及一种基于消费者行为的舆情监控系统。
技术介绍
舆情监测系统,是指通过相关的专业舆情软件按照一定的规则和方法将互联网上繁杂的信息当中关注的舆情信息抓取出来,并通过分析过滤等方式加工处理最终呈现出与需求相匹配的舆情信息。系统背景随着互联网的发展,互联网作为一种信息传播方式深入人们的生活中,网上言论的活跃程度不可估量。只是有重大得事件,就能成为网上舆论,通过互联网来表达观点,传播舆论进而产生舆论压力。互联网已成为舆论的放大器,并且互联网舆论已达到任何部门和机构都无法忽视的境界。互联网舆情是通过互联网的论坛博客微博新闻跟回转贴等等方式对现实生活中的某些热点、焦点问题进行影响性、倾向性的言论和观点。如果引导不善,将会产生负面的舆情,对会社会安全构成威胁。舆情监测系统主要构成舆情分析引擎系统1、热点话题、敏感话题识别,可以根据新闻出处权威度、评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题。2、倾向性分析,对于每个话题,对每个发信人发表的文章的观点、倾向性进行分析与统计。3、主题跟踪,分析新发表文章、贴子的话题是否与已有主题相同。4、自动摘要,对各类主题,各类倾向能够形成自动摘要。5、趋势分析,分析某个主题在不同的时间段内,人们所关注的程度。6、突发事件分析,对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。7、报警系统,对突发事件、涉及内容安全的敏感话题及时发现并报警。8、统计报告,根据舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。信息采集系统主要是通过网络页面之间的链接关系,从网上自动获取页面信息,并且随着链接不断向整个网络扩展。目前,一些搜索引擎使用这项技术对全球范围内的网页进行检索。舆情监控系统应能根据用户信息需求,设定主题目标,使用人工参预和自动信息采集结合的方法完成信息收集任务。信息分析系统使用系统的观点和方法,把复杂对象分解为简单组成部分并确定这些组成部分的基本属性和关系的过程信息数据管理系统对收集到信息进行最终处理;对搜索引擎数据集进行阶段性的数据维护。现有技术的缺点在于:目前还没有一款舆情监测系统是根据消费者行为进行分析的,例如在此之前的一些商品抵制行为都是属于消费者行为,因此针对这类信息进行舆情监控显然是很有必要的。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于消费者行为的舆情监控系统,根据消费者的行为并结合当下实时新闻做出舆情分析。本专利技术的目的是通过以下技术方案来实现的:基于消费者行为的舆情监控系统,该系统包括:爬虫模块,包括用于向各电商平台爬取消费者行为数据的网络爬虫,以及用于向互联网爬取热点新闻的网络爬虫;数据库,用于存储网络爬虫从电商平台爬取的消费者行为数据;数据分类模块,用于将消费者行为数据进行分类统计,并将统计结果发送给舆情分析服务器;舆情分析服务器;用于接收网络爬虫爬取到的热点新闻和数据分类模块发来的消费者行为数据,并从消费者行为数据中提取与热点新闻相匹配或相关联的信息,并作出指导性的舆情分析结果。进一步的,所述消费者行为数据包括消费者购买商品信息、消费者对商品的评价,所述商品信息包括商品种类、商品价格、商品所属企业、以及商品所属企业的类型、商品所属企业的国别。进一步的,所述舆情分析服务器与电商平台导通用于获取对应消费者的ID的性别和年龄信息。进一步的,所述数据分类模块具体功能为:对消费者购买的商品按商品分类表进行分类;对消费者购买商品的所属企业类别进行分类,分为国企和民营企业;对消费者购买商品的评论内容进行分类,分为商品质量评价、商家服务评价、商品所属企业评价;对消费者购买商品的价格进行排序分类,统计消费水平的聚集点。进一步的,所述舆情分析服务器分析内容包括:根据商品类别信息关联各行业的热门新闻进行舆情分析;根据消费者购买商品所属企业类型关联当下的企业纠纷新闻进行舆情分析;根据消费者的评论关键词关联当下国际热门新闻进行舆情分析;根据消费者购买商品的价格关联当下生活质量相关的热门新闻进行舆情分析;根据各国商品的销售量关联当下国际关系热门新闻进行舆情分析。进一步的,所述消费者的评论关键词包括国家名字、政治敏感词汇、宗教信仰词汇、民族词汇。进一步的,所述各国商品的销售量是指以品牌名或生产商计算该商品的销售量。本专利技术的有益效果是:本专利技术借助消费者的消费行为结合当下的实时新闻进行舆情分析,可用于分析社会间的各种商品抵制活动,国与国之间的商品抵制行为,人民生活水平程度分析。附图说明图1为本专利技术的系统框图。具体实施方式下面结合具体实施例进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。如图1所示,基于消费者行为的舆情监控系统,该系统包括:爬虫模块,包括用于向各电商平台爬取消费者行为数据的网络爬虫,以及用于向互联网爬取热点新闻的网络爬虫,热点新闻的爬取为实时爬取,即一旦网络出现热点新闻则爬取该新闻内容,而取消费者行为数据爬取则可以采用定时爬取的方式,例如网购一般集中在18:00-23:00之间,因此取消费者行为数据爬取可以采用每天凌晨爬取一次的方式为最佳。数据库,用于存储网络爬虫从电商平台爬取的消费者行为数据,数据库采用多层结构,每日数据单独存储,存储时间为5-10天,即数据爬取后每隔5-10天数据库丢弃,从而保证数据库的清洁度,使得数据更为简洁,便于分析统计,同时也是结合热点新闻的热度问题,一般情况下一个热点新闻的热度保持时间为5-10天,因此本专利技术中设计5-10天清理一次数据是合理的。数据分类模块,用于将消费者行为数据进行分类统计,并将统计结果发送给舆情分析服务器;在进行统计分析时,同一类的数据应统计连续5-10天的数据,而不是每天单独统计一次,例如在统计某品牌销售数据时,应统计截止目前为止过去5-10天的全部数据,包括数据总数以及数据的变化趋势。舆情分析服务器;用于接收网络爬虫爬取到的热点新闻和数据分类模块发来的消费者行为数据,并从消费者行为数据中提取与热点新闻相匹配或相关联的信息,并作出指导性的舆情分析结果。更为具体的,上述消费者行为数据包括消费者购买商品信息、消费者对商品的评价,所述商品信息包括商品种类、商品价格、商品所属企业、以及商品所属企业的类型、商品所属企业的国别;舆情分析服务器与电商平台导通用于获取对应消费者的ID的性别和年龄信息,即相当于获取用户的匿名信息,不公开用户身份,而年龄层和性别作为分析的主要维度则应该采集,而这些数据对又不会对消费者用户造成影响,因此获取用户性别和年龄信息是用户可以接受的,在实际操作层面而言具备可行性。更为具体的,上述数据分类模块具体功能为:对消费者购买的商品按商品分类表进行分类,即统计个电商平台各类商品的销售量,例如手机等电子产品销量、服装服饰销量、化妆品销量。对消费者购买商品的所属企业类别进行分类,分为国企和民营企业对消费者购买商品的评论内容进行分类,分为商品质量评价、商家服务评价、商品所属企业评价;对消费者购买商品的价格进行排序分类,统计消费水平的聚集本文档来自技高网
...

【技术保护点】
1.基于消费者行为的舆情监控系统,其特征在于,该系统包括:爬虫模块,包括用于向各电商平台爬取消费者行为数据的网络爬虫,以及用于向互联网爬取热点新闻的网络爬虫;数据库,用于存储网络爬虫从电商平台爬取的消费者行为数据;数据分类模块,用于将消费者行为数据进行分类统计,并将统计结果发送给舆情分析服务器;舆情分析服务器;用于接收网络爬虫爬取到的热点新闻和数据分类模块发来的消费者行为数据,并从消费者行为数据中提取与热点新闻相匹配或相关联的信息,并作出指导性的舆情分析结果。

【技术特征摘要】
1.基于消费者行为的舆情监控系统,其特征在于,该系统包括:爬虫模块,包括用于向各电商平台爬取消费者行为数据的网络爬虫,以及用于向互联网爬取热点新闻的网络爬虫;数据库,用于存储网络爬虫从电商平台爬取的消费者行为数据;数据分类模块,用于将消费者行为数据进行分类统计,并将统计结果发送给舆情分析服务器;舆情分析服务器;用于接收网络爬虫爬取到的热点新闻和数据分类模块发来的消费者行为数据,并从消费者行为数据中提取与热点新闻相匹配或相关联的信息,并作出指导性的舆情分析结果。2.根据权利要求1所述的基于消费者行为的舆情监控系统,其特征在于,所述消费者行为数据包括消费者购买商品信息、消费者对商品的评价,所述商品信息包括商品种类、商品价格、商品所属企业、以及商品所属企业的类型、商品所属企业的国别。3.根据权利要求2所述的基于消费者行为的舆情监控系统,其特征在于,所述舆情分析服务器与电商平台导通用于获取对应消费者的ID的性别和年龄信息。4.根据权利要求3所述的基于消费者行为的舆情监控系统,其特征在于,所述数据分类模块具体...

【专利技术属性】
技术研发人员:张永生
申请(专利权)人:成都德迈安科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1