System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于舆情数据的景气分析方法及装置、设备、存储介质制造方法及图纸_技高网

基于舆情数据的景气分析方法及装置、设备、存储介质制造方法及图纸

技术编号:40432294 阅读:6 留言:0更新日期:2024-02-22 22:58
本申请实施例公开了一种基于舆情数据的景气分析方法及装置、设备、存储介质,包括:根据预设的知识图谱,获取舆情数据;根据预设的评价项目对各指标维度对应的舆情数据进行处理,得到各指标维度的统计数据;对各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据舆情关注度得到各指标维度对应的至少一个指标的指标权重;根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率和增长率期望值,得到各指标对应的评价分值;将各指标对应的评价分值和指标权重相乘并求和,得到目标行业景气评分。能够根据舆情数据,对不同指标维度的指标赋予相应的权重,提高了景气分析结果的准确性。

【技术实现步骤摘要】

本申请实施例涉及数据处理,涉及但不限于一种基于舆情数据的景气分析方法及装置、设备、存储介质


技术介绍

1、景气分析中的预警信号灯分析法,是指选择一组能够敏感反映行业发展景气程度的评价指标,利用相关数据处理方法确定阈值区间得到综合指标,然后采用信号灯亮灯机制对这组评价指标和综合指标对当时的周期波动状况发出预警信号。其中,红灯表示过热,黄灯表示偏热,绿灯表示正常平稳,浅蓝灯表示偏冷,蓝灯表示过冷,能够用于对目标行业的景气情况进行分析。

2、在相关行业景气分析技术中,常使用专家打分法等主观赋值法会造成预警信息不准确,而使用客观赋值法,强依赖样本情况,容易发生权重失真,与业务实际情况不符的情况。例如,在存才多个评价指标分析行业景气的情况下,各评价指标对于行业景气的影响程度可能并不相同,若不对各评价指标赋予不同的权重,会致使得到的行业景气分析结果不准确。

3、因此,在行业景气分析过程中,合理地对不同的评价指标赋予相应的权重,是一个亟待解决的问题。


技术实现思路

1、有鉴于此,本申请实施例提供的基于舆情数据的景气分析方法及装置、设备、存储介质,能够对获取到的舆情数据进行处理,得到用于行业景气分析的多个指标维度分别对应的至少一个指标的指标权重,提高了对数据的行业景气分析结果的准确性。本申请实施例提供的基于舆情数据的景气分析方法及装置、设备、存储介质是这样实现的:

2、本申请实施例提供的基于舆情数据的景气分析方法,包括:

3、根据预设的知识图谱,获取舆情数据,所述知识图谱包括用于目标行业的景气分析处理的多个指标维度、各指标维度对应的至少一个指标、以及各指标维度对应的舆情关键词;

4、根据预设的评价项目对各指标维度对应的舆情数据进行处理,得到各指标维度的统计数据,所述评价项目包括各指标维度对应的舆情数据的发布量、阅读量、分享次数、评论次数以及点赞次数;

5、对所述各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据所述各指标维度对应的舆情关注度得到各指标维度对应的至少一个指标的指标权重,各指标维度对应的至少一个指标的指标权重与各指标维度对应的舆情关注度为正相关关系;

6、根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率与增长率期望值,得到各指标对应的评价分值;

7、将各指标对应的评价分值和指标权重相乘并求和,得到目标行业景气评分,所述目标行业景气评分用于指示所述目标行业的发展趋势,所述目标行业景气评分越高,所述目标行业的发展趋势越好。

8、在一些实施例中,所述对所述各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据所述各指标维度对应的舆情关注度得到各指标维度对应的至少一个指标的指标权重,包括:

9、根据所述统计数据,计算各指标维度对应的维度信息熵;

10、根据所述各指标维度对应的维度信息熵,计算各指标维度对应的舆情权重;

11、将所述各指标维度对应的舆情权重与各指标维度对应的多个评价项目的平均数据量相乘,得到各指标维度对应的舆情关注度;

12、分别计算各指标维度对应的舆情关注度在所有舆情关注度总和的占比,得到各指标维度对应的维度权重;

13、根据各指标维度对应的维度权重,获取各指标维度对应的至少一个指标的指标权重,各指标维度对应的维度权重为对应的指标维度的所有指标的指标权重之和。

14、在一些实施例中,所述根据所述统计数据,计算各指标维度对应的维度信息熵,包括:

15、根据归一化公式对所述统计数据进行归一化处理,得到各指标维度对应的不同评价项目的归一化数值;

16、计算各指标维度中,各评价项目的归一化数值在所有评价项目的归一化数值总和的占比,得到各指标维度中各评价项目的项目权重;

17、根据维度信息熵计算公式,得到各指标维度对应的维度信息熵,所述维度信息熵计算公式为:

18、

19、其中,ej为所述多个指标维度中的任意一个指标维度j对应的维度信息熵,m为所述评价项目的项目数目,pij为所述指标维度j的任意一个评价项目i对应的项目权重;

20、所述归一化公式为:

21、

22、其中,yij为所述多个指标维度中的任意一个指标维度j的任意一个评价项目i对应的归一化数值,xij为所述指标维度j的任意一个评价项目i对应的项目数值,min(xj)为所述指标维度j对应的各评价项目中最小的项目数值,max(xj)为所述指标维度j对应的各评价项目中最大的项目数值。

23、在一些实施例中,所述根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率与增长率期望值,得到各指标对应的评价分值,包括:

24、获取预设时间段内各指标对应的历史采集数据;

25、根据所述时间间隔,对所述历史采集数据进行同比的增长率计算,得到各指标对应的多个历史增长率;

26、计算各指标对应的多个历史增长率的均值,获取各指标的增长率期望值;

27、根据所述时间间隔,获取各指标对应的当前采集数据;

28、根据所述时间间隔,计算所述当前采集数据与所述历史采集数据在相同时期的各指标的实际增长率;

29、计算各指标的实际增长率与对应的指标的增长率期望值的差值,根据各指标对应的差值获取各指标的评价分值。

30、在一些实施例中,所述计算各指标的实际增长率与对应的指标的增长率期望值的差值,根据各指标对应的差值获取各指标的评价分值,包括:

31、计算各指标的实际增长率与对应的指标的增长率期望值的差值;

32、根据各指标对应的多个历史增长率,得到各指标对应的多个差值范围;

33、根据预警信号灯方法以及所述各指标对应的多个差值范围,得到各指标对应的信号灯颜色,不同的信号灯颜色对应的差值范围不同,根据预设的信号灯颜色与评价分值的对应关系,获取各指标的评价分值。

34、在一些实施例中,所述根据各指标对应的多个历史增长率,得到各指标对应的多个差值范围,包括:

35、根据各指标对应的多个历史增长率,计算各指标对应的多个历史增长率的标准差;

36、根据各指标对应的不同目标倍数的标准差,得到各指标对应的多个差值范围,所述目标倍数的标准差包括一倍标准差和两倍标准差。

37、在一些实施例中,所述根据各指标维度对应的维度权重,获取各指标维度对应的至少一个指标的指标权重,包括:

38、分别将各指标维度对应的维度权重除以各指标维度对应的所有指标的总数目,得到各指标维度对应的至少一个指标的指标权重。

39、本申请实施例提供的基于舆情数据的景气分析装置,包括:

40、数据获取模块,用于根据预设的知识图谱,获取舆情数据,所述知识图本文档来自技高网...

【技术保护点】

1.一种基于舆情数据的景气分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据所述各指标维度对应的舆情关注度得到各指标维度对应的至少一个指标的指标权重,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述统计数据,计算各指标维度对应的维度信息熵,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率与增长率期望值,得到各指标对应的评价分值,包括:

5.根据权利要求4所述的方法,其特征在于,所述计算各指标的实际增长率与对应的指标的增长率期望值的差值,根据各指标对应的差值获取各指标的评价分值,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据各指标对应的多个历史增长率,得到各指标对应的多个差值范围,包括:

7.根据权利要求2所述的方法,其特征在于,所述根据各指标维度对应的维度权重,获取各指标维度对应的至少一个指标的指标权重,包括:

8.一种基于舆情数据的景气分析装置,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种基于舆情数据的景气分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据所述各指标维度对应的舆情关注度得到各指标维度对应的至少一个指标的指标权重,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述统计数据,计算各指标维度对应的维度信息熵,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率与增长率期望值,得到各指标对应的评价分值,包括:

5.根据权利要求4所述的方法,其特征在于,所述计算各指标的实际增长率与对应的指标的增长率期望值的差值...

【专利技术属性】
技术研发人员:张迎峰刘斐马鑫磊王菁方辉敏黎永昇王振林令杨双罗慧瑜蔡家思陈慧婷
申请(专利权)人:联通广东产业互联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1