一种基于汽车行业的舆情数据分析方法技术

技术编号:25185578 阅读:19 留言:0更新日期:2020-08-07 21:13
本发明专利技术提供一种基于汽车行业舆情数据分析方法,通过获取汽车行业的所有网络信息内容;基于特征词对所述网络信息内容进行机器学习,判断是否存在相同特征词;将存在相同特征词的网络信息内容归为相似群;根据所述相似群计算汽车行业的关注度,基于所述关注度计算汽车行业舆情健康状况。本发明专利技术能够通过计算所有平台的影响力来衡量其背后的商业价值,辅助验证投入和产出是否合理;本发明专利技术还可以在复杂的网络舆论场,汽车品牌利用影响力算法模型合理评估当下舆情健康状况(即正向信息与负向信息的占比情况),并基于此制定合理的舆情策略。

【技术实现步骤摘要】
一种基于汽车行业的舆情数据分析方法
本专利技术涉及数据分析
,特别是涉及一种基于汽车行业的舆情数据分析方法。
技术介绍
随着舆论环境的日益发展,品牌舆情越来越难以仅通过人工监测评估,媒体数量粉尘化、内容源头无理化、传播形式病毒化、媒体平台利益化、跟风言论情绪化种种,新舆论环境场,需要建立客观的评估指标来评判舆情状况。目前大多平台数据一般不对外开放通用数据获取接口,导致数据获取难度较大,难以标准化进行分析。同时,目前市场上没有对于文章或视频影响力成型权威的判断标准,个人也无法通过其他的方式来构建这个标准,从而造成了大多数人评定的影响力权威性不强的问题,因而也不具备行业性评估标准。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于汽车行业的舆情数据分析方法,用于解决现有技术存在的问题。为实现上述目的及其他相关目的,本专利技术提供一种基于汽车行业的舆情数据分析方法,包括有如下步骤:获取汽车行业的所有网络信息内容;基于特征词对所述网络信息内容进行机器学习,判断是否存在相同特征词;将存在相同特征词的网络信息内容归为相似群;根据所述相似群计算汽车行业的关注度,基于所述关注度计算汽车行业舆情健康状况。可选地,所述网络信息内容的来源包括以下至少之一:网站、网页、客户端、微博、微信、论坛、视频平台、问答平台。可选地,若所述网络信息内容的来源为网站或网页,则所述网站或网页中汽车行业的关注度包括可直接采集阅读数的网站或网页文章和不可直接采集阅读数的网站或网页文章;其中,可直接采集阅读数的网站或网页文章关注度=相似群阅读数之和÷1000;不可直接采集阅读数的网站或网页首页单篇文章关注度=(首页文章页面浏览量加权系数*网站总页面浏览量÷网站总链接数÷10)÷1000。可选地,若所述网络信息内容的来源为客户端,则所述客户端中汽车行业的关注度包括可直接采集阅读数的客户端文章和不可直接采集阅读数的客户端文章;其中,可直接采集阅读数的客户端文章关注度=相似群阅读数之和÷1000;不可直接采集阅读数的客户端首页单篇文章关注度=(首页文章页面浏览量加权系数*网站总页面浏览量÷网站总链接数÷10)÷1000。可选地,若所述网络信息内容的来源为微信,则所述微信中汽车行业的关注度包括可直接采集阅读数的微信文章关注度,其中,可直接采集阅读数的微信文章关注度=相似群阅读数之和÷1000。可选地,若所述网络信息内容的来源为微博,则所述微博中汽车行业的关注度包括微博关注度,其中,微博关注度=(EXP(LN(转发数+评论数+点赞数+1)*1.1-LN(转发数+评论数+点赞数+1)^2*0.18+LN(转发数+评论数+点赞数+1)^3*0.013+7.64)-1)÷1000;当转发数+评论数+点赞数=0时,赋值微博阅读量为100,即微博关注度为0.1。可选地,若所述网络信息内容的来源为论坛,则所述论坛中汽车行业的关注度包括论坛帖关注度,其中,论坛帖关注度=相似论坛帖阅读数之和÷1000。可选地,若所述网络信息内容的来源为问答平台,则所述问答平台中汽车行业的关注度包括可直接采集阅读数的问答平台文章关注度和不可直接采集阅读数的问答平台文章关注度,其中,可直接采集阅读数的问答平台文章关注度=问题阅读量÷1000;不可直接采集阅读数的问答平台文章关注度=(首页文章页面浏览量加权系数*网站总页面浏览量÷网站总链接数÷10)÷1000。可选地,若所述网络信息内容的来源为视频平台,则所述视频平台中汽车行业的关注度包括可直接采集阅读数的视频平台文章关注度和不可直接采集阅读数的视频平台文章关注度,其中,可直接采集阅读数的视频平台文章关注度=相似视频群阅读数之和÷1000;不可直接采集阅读数的视频平台文章关注度=(首页文章页面浏览量加权系数*网站总页面浏览量÷网站总链接数÷10)÷1000。可选地,单篇相似群的关注度=总阅读量÷1000;至少包括:单篇相似群在多平台上的关注度=(微博阅读数+微信阅读数+网站阅读数+网页阅读数+客户端阅读数+论坛阅读数+视频平台阅读数+问答平台阅读数)÷1000。如上所述,本专利技术提供的一种基于汽车行业舆情数据分析方法,具有以下有益效果:通过获取汽车行业的所有网络信息内容;基于特征词对所述网络信息内容进行机器学习,判断是否存在相同特征词;将存在相同特征词的网络信息内容归为相似群;根据所述相似群计算汽车行业的关注度,基于所述关注度计算汽车行业舆情健康状况。本专利技术能够通过计算所有平台的影响力来衡量其背后的商业价值,辅助验证投入和产出是否合理;本专利技术还可以在复杂的网络舆论场,汽车品牌利用影响力算法模型合理评估当下舆情健康状况(即正向信息与负向信息的占比情况),并基于此制定合理的舆情策略。附图说明图1为一实施例提供的基于汽车行业的舆情数据分析方法。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。关注度:媒体或用户在统计周期内对品牌或车型或某一事件的关注程度。(1个关注度=1000个阅读数)声量:品牌或车型或某一事件在统计周期内网络传播扩散的总量。请参阅图1,本专利技术提供一种基于汽车行业的舆情数据分析方法,包括有如下步骤:S100,获取汽车行业的所有网络信息内容;S200,基于特征词对所述网络信息内容进行机器学习,判断是否存在相同特征词;将存在相同特征词的网络信息内容归为相似群;其中,客户端、微信、微博、网站中标题相同或文章内容80%相似,则判定客户端、微信、微博、网站中存在相似群;论坛主帖标题一致或主帖内容80%相似,则判定论坛存在相似群;视频标题一致或视频内容相似,则判定视频平台存在相似群。S300,根据所述相似群计算汽车行业的关注度,基于所述关注度计算汽车行业舆情健康状况。本专利技术通过获取汽车行业的所有网络信息内容;基于特征词对所述网络信息内容进行机器学习,判断是否存在相同特征词;将存在相同特征词的网络信息内容归为相似群;根据所述相似群计算汽车行业的关注度,基于所述关注度计算汽车行业舆情健康状况。本专利技术能够通过计算所有平台的影响力来衡量其背后的商业价值,辅助验证投入和产出是否合理;本专利技术还可以在复杂的网络舆论本文档来自技高网...

【技术保护点】
1.一种基于汽车行业的舆情数据分析方法,其特征在于,包括有如下步骤:/n获取汽车行业的所有网络信息内容;/n基于特征词对所述网络信息内容进行机器学习,判断是否存在相同特征词;将存在相同特征词的网络信息内容归为相似群;/n根据所述相似群计算汽车行业的关注度,基于所述关注度计算汽车行业舆情健康状况。/n

【技术特征摘要】
1.一种基于汽车行业的舆情数据分析方法,其特征在于,包括有如下步骤:
获取汽车行业的所有网络信息内容;
基于特征词对所述网络信息内容进行机器学习,判断是否存在相同特征词;将存在相同特征词的网络信息内容归为相似群;
根据所述相似群计算汽车行业的关注度,基于所述关注度计算汽车行业舆情健康状况。


2.根据权利要求1所述的基于汽车行业的舆情数据分析方法,其特征在于,所述网络信息内容的来源包括以下至少之一:网站、网页、客户端、微博、微信、论坛、视频平台、问答平台。


3.根据权利要求2所述的基于汽车行业的舆情数据分析方法,其特征在于,若所述网络信息内容的来源为网站或网页,则所述网站或网页中汽车行业的关注度包括可直接采集阅读数的网站或网页文章和不可直接采集阅读数的网站或网页文章;其中,
可直接采集阅读数的网站或网页文章关注度=相似群阅读数之和÷1000;
不可直接采集阅读数的网站或网页首页单篇文章关注度=(首页文章页面浏览量加权系数*网站总页面浏览量÷网站总链接数÷10)÷1000。


4.根据权利要求2所述的基于汽车行业的舆情数据分析方法,其特征在于,若所述网络信息内容的来源为客户端,则所述客户端中汽车行业的关注度包括可直接采集阅读数的客户端文章和不可直接采集阅读数的客户端文章;其中,
可直接采集阅读数的客户端文章关注度=相似群阅读数之和÷1000;
不可直接采集阅读数的客户端首页单篇文章关注度=(首页文章页面浏览量加权系数*网站总页面浏览量÷网站总链接数÷10)÷1000。


5.根据权利要求2所述的基于汽车行业的舆情数据分析方法,其特征在于,若所述网络信息内容的来源为微信,则所述微信中汽车行业的关注度包括可直接采集阅读数的微信文章关注度,其中,
可直接采集阅读数的微信文章关注度=相似群阅读数之和÷1000。


6.根据权利要求2所述的基于汽车行业的舆情数据分析方法,其特征在于,若所述网络信息内容的来源为微博...

【专利技术属性】
技术研发人员:毛雷雷何庆海伊鹏翔
申请(专利权)人:宣亚国际营销科技北京股份有限公司上海分公司
类型:发明
国别省市:上海;31

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1