一种网约车舆情监控方法技术

技术编号:32528031 阅读:11 留言:0更新日期:2022-03-05 11:21
本发明专利技术提供的一种网约车舆情监控方法,所述监控方法包括:向目标站点发起请求,获取响应内容;将所述响应内容进行解析,获得解析数据,将所述解析数据存入数据库;采用结巴词库的分词技术将爬虫抓取的文字信息进行分词整理,并通过词云函数可视化抓取结果,获得可视化图文结果;将所述可视化图文结果发送至钉钉工作群。全面地对消费者关心的信息进行立体监测,及时预警负面、重要、重点信息,实时跟踪突发事件舆情信息。发事件舆情信息。发事件舆情信息。

【技术实现步骤摘要】
一种网约车舆情监控方法


[0001]本专利技术涉及网约车领域,尤其涉及一种网约车舆情监控方法。

技术介绍

[0002]在目前的网约车重大事故处理过程中,会存在如下问题:一般受害人在受到不当侵害时,第一时间想到的是去一些较大的公共媒体平台曝光受害的经历,希望造成更大范围的影响。
[0003][0004][0005][0006][0007][0008][0009][0010]因此如何全面地对消费者关心的信息进行立体监测,及时预警负面、重要、重点信息,实时跟踪突发事件舆情信息。

技术实现思路

[0011]鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种网约车舆情监控方法。
[0012]根据本专利技术的一个方面,提供了一种网约车舆情监控方法,所述监控方法包括:
[0013]向目标站点发起请求,获取响应内容;
[0014]将所述响应内容进行解析,获得解析数据,将所述解析数据存入数据库;
[0015]采用结巴词库的分词技术将爬虫抓取的文字信息进行分词整理,并通过词云函数可视化抓取结果,获得可视化图文结果;
[0016]将所述可视化图文结果发送至钉钉工作群。
[0017]可选的,所述向目标站点发起请求,获取响应内容具体包括:
[0018]使用http库向目标站点发起请求,发送一个请求,所述请求包括请求头和请求体;
[0019]服务器正常响应,得到一个响应,所述响应包括html,json,图片,视频。
[0020]可选的,所述将所述响应内容进行解析,获得解析数据具体包括:
[0021]在python3中安装结巴词库,pip installjieba;
[0022]从爬虫抓取到的数据,筛选出中文部分;
[0023]调用结巴词库分词模块,将筛选出的中文部分,拆分为具备独立意义的词语;
[0024]调用词云图模块,将拆分开的词语按出现的频次可视化地展示出来,易于分析人员快速读取有价值的信息。
[0025]可选的,所述将所述可视化图文结果发送至钉钉工作群具体包括:
[0026]将重大舆情信息以文字概要形式及时播报至舆情实时监控群,并通知主要负责
人;
[0027]将近几日重大舆情信息词云图,播报至舆情实时监控群,提醒相关负责人近期重大舆情信息。
[0028]本专利技术提供的一种网约车舆情监控方法,所述监控方法包括:向目标站点发起请求,获取响应内容;将所述响应内容进行解析,获得解析数据,将所述解析数据存入数据库;采用结巴词库的分词技术将爬虫抓取的文字信息进行分词整理,并通过词云函数可视化抓取结果,获得可视化图文结果;将所述可视化图文结果发送至钉钉工作群。全面地对消费者关心的信息进行立体监测,及时预警负面、重要、重点信息,实时跟踪突发事件舆情信息。
[0029]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0030]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0031]图1为本专利技术实施例提供的一种网约车舆情监控方法。
具体实施方式
[0032]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0033]本专利技术的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0034]下面结合附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0035]如图1所示,Python爬虫和结巴词库在网约车舆情监控方面的应用共分为三个环节。分别为第一步通过Python爬虫按关键词抓取主流媒体上用户发布或评论的文字信息;
[0036]爬虫获取网络数据的方式:模拟浏览器发送请求(获取网页代码)

>提取有用的数据

>存放于数据库或文件中。
[0037]Python爬虫按关键词抓取主流媒体上用户发布或评论的文字信息。
[0038]抓取主流媒体上用户发布或评论的文字信息,关键词的选取很重要,为准确抓取重大舆情信息可以参考如下关键词:首汽约车、滴滴、曹操专车、网约车、司机、投诉、骚扰等。
[0039]通过结巴词库的分词技术将爬虫抓取的文字信息进行分词整理,并通过词云函数可视化抓取的结果;
[0040]将前面爬虫抓取的数据存储在变量value中。
[0041]安装JieBe词库:在python3中安装结巴词库,pip installjieba。
[0042]提取中文:从爬虫抓取到的数据,筛选出中文部分。
[0043]结巴分词:调用结巴词库分词模块,将筛选出的中文部分,拆分为具备独立意义的词语。
[0044]词云可视化:调用词云图模块,将拆分开的词语按出现的频次可视化地展示出来,易于分析人员快速读取有价值的信息。
[0045]第三步将可视化的图文结果自动发送至钉钉工作群,让负责公关的员工及时了解最新舆情信息。
[0046]将重大舆情信息以文字概要形式及时播报至舆情实时监控群,并艾特主要负责人。
[0047]将近几日重大舆情信息词云图,播报至舆情实时监控群,提醒相关负责人近期重大舆情信息。
[0048]通过结巴词库的分词技术将爬虫抓取的文字信息进行分词整理,并通过词云函数可视化抓取的结果。
[0049]为了将爬虫抓取的文字信息提炼成更有价值的信息,引入结巴中文词库,将长长的句子转化为常规的词语。
[0050]结巴词库分词原理:利用中文词库,确定汉字之间的关联概率;汉字间概率大的组成词语,形成分词结果。
[0051]然后将词语按出现频次形成可视化的词云图。
[0052]将可视化的图文结果自动发送至钉钉工作群,让负责公关的员工及时了解最新舆情信息。
[0053]通过钉钉机器人技术将重大舆情信息及时同步给公共关系的员工群。只要抓取到如下关键词,认为是重大舆情信息:违规、跳车、性骚扰、垃圾平台。
[0054]有益效果:通过将现有技术爬虫、分词、机器人组合在一起,应用于网约车行业重大舆情事件监控,全面地对消费者关心的信息进行立体监测,及时预警负面、重要、重点信息,实时跟踪突发事件舆情信息。及时挽回网约车企业的声誉和形本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网约车舆情监控方法,其特征在于,所述监控方法包括:向目标站点发起请求,获取响应内容;将所述响应内容进行解析,获得解析数据,将所述解析数据存入数据库;采用结巴词库的分词技术将爬虫抓取的文字信息进行分词整理,并通过词云函数可视化抓取结果,获得可视化图文结果;将所述可视化图文结果发送至钉钉工作群。2.根据权利要求1所述的一种网约车舆情监控方法,其特征在于,所述向目标站点发起请求,获取响应内容具体包括:使用http库向目标站点发起请求,发送一个请求,所述请求包括请求头和请求体;服务器正常响应,得到一个响应,所述响应包括html,json,图片,视频。3.根据权利要求1所述的一种网约车舆情监控方法,...

【专利技术属性】
技术研发人员:张鹤迎
申请(专利权)人:首约科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1