宏观经济指标舆情数据库制造技术

技术编号:37318017 阅读:10 留言:0更新日期:2023-04-21 22:59
本发明专利技术公开了宏观经济指标舆情数据库,包括宏观数据指标模块和舆情数据指标模块;所述宏观数据指标模块包括国民经济核算单元、人口单元、就业人员和职工工资单元、固定资产投资单元、对外经济贸易单元、能源单元、财政单元、价格指数单元、人民生活单元、城市概况单元、资源与环境单元、农业单元、工业单元、建筑业单元、运输和邮电单元、国内贸易单元、金融单元、教育和科技单元、文化体育和卫生单元、社会管理单元、社会服务单元和社会保障单元。本发明专利技术基于原始的宏观数据库,通过二次挖掘宏观数据指标,创造了宏观指标的网络舆情数值数据,为学者研究丰富了数据指标与内容,增加新的学术研究场景。研究场景。研究场景。

【技术实现步骤摘要】
宏观经济指标舆情数据库


[0001]本专利技术属于数据库
,具体涉及宏观经济指标舆情数据库。

技术介绍

[0002]近些年,随着国家不断加大对经济类、管理类等社会学科的支持,这些学科科研呈现出百花齐放的局面。与之相对应的是,相关科研工作者对于科研的需求也越来越多。总结、挖掘前人的研究成果,并从中得到启发、进而创新,是科研工作者进行研究的一个重要方面。
[0003]随着网络信息的发展,越来越多的人通过网络了解信息,发表言论,网络逐渐占据人们生活的大多数时间,由于网络存在匿名言论的优势,对网络的舆情监控则应运而生。而经济学对于舆情的研究更多的是舆情的传播路径等方面的研究,尚未有学者研究舆情指标数据对某一些宏观经济指标的影响。
[0004]舆情应用的发展现状主要是做舆情监控,监测不良舆情事件的发生,传播,影响等,目前市场上有很多舆情监控平台,从文本舆情到视频舆情,都是为政府企业或者个人提供舆情监测,舆情预警,舆情分析和舆情报告。
[0005]我国统计局每年都会发布很多统计数据,市面上有很多产品将这些数据进行收集整理,做成数据库的形式,为高校的科研提供数据服务,但是市面上的宏观数据库里边的数据均为国家发布的统计数据,市面上目前还没有产品发布宏观指标的舆情数据库,宏观数据本身具有一定的研究价值,但是在网络舆情越来越发达的现在社会,宏观指标的舆情统计数据也有很好的研究价值。
[0006]综上,舆情指标数据对宏观指标数据的影响这个方向目前还没有人研究,宏观经济指标和舆情指标整合在一个数据库中,同时可以为舆情数据寻找一个新的研究形式,其次可以为被研究过太多次的宏观指标增加新的研究方向。

技术实现思路

[0007]本专利技术的目的在于提供宏观经济指标舆情数据库,以解决上述
技术介绍
中提出的问题。
[0008]为实现上述目的,本专利技术提供如下技术方案:宏观经济指标舆情数据库,包括宏观数据指标模块和舆情数据指标模块;
[0009]所述数据库建立过程为从社交平台收集舆情数据,筛选出国民经济行业指标的舆情文本数据,根据正负面等进行判断,并统计不同分类下的舆情数量,按照时间,地区,经济指标,舆情指标等筛选条件建立相应的数据库,其中指标包括宏观数据指标模块和舆情数据指标模块。
[0010]所述判断标准采用判别分析模型,包括不限于逻辑回归,决策树,神经网络等。
[0011]所述宏观数据指标模块包括国民经济核算单元、人口单元、就业人员和职工工资单元、固定资产投资单元、对外经济贸易单元、能源单元、财政单元、价格指数单元、人民生
活单元、城市概况单元、资源与环境单元、农业单元、工业单元、建筑业单元、运输和邮电单元、国内贸易单元、金融单元、教育和科技单元、文化体育和卫生单元、社会管理单元、社会服务单元和社会保障单元;
[0012]所述舆情数据指标模块包括标题出现关键词的新闻总数单元、内容出现关键词的新闻总数单元、正面舆情新闻数单元、中性舆情新闻数单元、负面舆情新闻数单元、发帖数量单元、参与发帖人数单元、阅读次数单元、评论次数单元、转发次数单元、分享次数单元、收藏次数单元、负面关联词语单元、正面关联词语单元、中性关联词语单元、关联词语词频单元。
[0013]优选的,所述国民经济核算单元包括第一产业、农林牧渔业、第二产业、工业增加值、建筑业、第三产业、交通运输业、邮政业、批发业、住宿业、餐饮业、金融业、房地产业、仓储业、居民消费水平、农村居民消费水平、城镇消费水平;所述人口单元包括全国总人口、男性人口、女性人口、城镇、乡村、出生率、死亡率、自然增长率、流动、普查、抽样调查;所述就业人员和职工工资单元包括就业人员数、职工工资、工资总额、城镇平均工资、农村失业人数、国有单位失业率、私营企业劳动报酬、外商投资单位平均工资指数、个体户平均货币工资指数、农





渔业平均实际工资指数、采掘业、制造业、交通运输、仓储和邮政业、批发零售贸易和餐饮业、批发和零售业、住宿和餐饮业、租赁和商务服务业、居民服务和其他服务业、社会服务业、城镇投资者人数、乡村投资者人数。
[0014]优选的,所述固定资产投资单元包括全社会固定资产投资的固定资产投资总额、民间固定资产投资的固定资产建设总规模、城镇固定资产投资的住宅投资、第一产业固定资产投资、第二产业固定资产投资、第三产业固定资产投资、房地产开发企业和销售面积;所述对外经济贸易单元包括进出口贸易和对外经济合作,所述进出口贸易包括进出口总额、出口总额、进口总额、进出口差额、出口货物、进口货物、货物进出口和外商投资企业货物进出口总额。
[0015]优选的,所述能源单元包括能源生产、能源消费、石油的可供量、煤炭的生产量、电力、能源加工转换效率,所述能源生产包括生产总量、原煤比重、原油比重、天然气比重、水电比重、核电比重和风电比重,所述电力包括进口量、出口量、消费量、平衡差额、能源生产弹性系数和能源消费弹性系数;所述能源加工转换效率包括发电及电站供热转换效率、炼焦转换效率和炼油转换效率。
[0016]优选的,所述财政单元包括国家财政收入、国家财政支出和国家债务,所述国家财政收入包括财政收入占比、税收和非税收收入,所述税收包括增值税、营业税、外贸企业出口退税、资源税、城市维护建设税、企业所得税、个人所得税、城镇土地使用税、契税、烟叶税、耕地占用税、证券交易印花税、房产税、印花税、土地增值税和车船税,所述非税收收入包括专项收入、行政事业性收费、罚没收入、国有资本经营收入、国有资源有偿使用收入、捐赠收入和政府住房基金收入,所述国家财政支出包括财政支出占比、一般公共服务支出、国内外债务付息支出、外交支出、对外援助支出、国防支出、公共安全支出、武装警察支出、教育支出、科学技术支出、文化体育与传媒支出、社会保障和就业支出、医疗卫生支出、环境保护支出、城乡社区事务支出、农林水事务支出、交通运输支出、车辆购置税支出、资源勘探电力信息事务支出、工业

商业

金融事务支出、商业服务业事务支出、金融监管支出、援助其他地区支出、地震灾后恢复重建支出、国土气象事务支出、住房保障支出、粮油物资储备管
理事务支出、灾害防治及应急管理支出、国债付息支出和债务发行费用支出,所述国家债务包括国内债务、国外债务、外债余额、外国政府贷款、国际金融组织贷款、国际商业贷款、贸易信贷、长期债务余额、短期债务余额、偿债率、负债率、债务率、政府性基金收入决算、政府性基金支出预算、股利、股息收入和国有资本经营收入决算。
[0017]优选的,所述价格指数单元包括居民消费价格指数、商品零售价格指数、工业品出厂价格指数、固定资产投资价格指数、农业生产资料价格指数、农产品生产价格指数、进出口商品价格指数和建筑安装工程价格指数;所述人民生活单元包括人民币储蓄存款、人均国内旅游花费、五险一金、人均收入、人均支出、人均消费和居民人均可支配收入。
[0018]优选的,所述城市概况单元包括城市年底人口数、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.宏观经济指标舆情数据库,其特征在于:从社交平台收集舆情数据,筛选出国民经济行业指标的舆情文本数据,根据正负面等进行判断,并统计不同分类下的舆情数量,按照时间,地区,经济指标,舆情指标筛选条件建立相应的数据库,其中舆情指标包括宏观数据指标模块和舆情数据指标模块;所述宏观数据指标模块包括国民经济核算单元、人口单元、就业人员和职工工资单元、固定资产投资单元、对外经济贸易单元、能源单元、财政单元、价格指数单元、人民生活单元、城市概况单元、资源与环境单元、农业单元、工业单元、建筑业单元、运输和邮电单元、国内贸易单元、金融单元、教育和科技单元、文化体育和卫生单元、社会管理单元、社会服务单元和社会保障单元;所述舆情数据指标模块包括标题出现关键词的新闻总数单元、内容出现关键词的新闻总数单元、正面舆情新闻数单元、中性舆情新闻数单元、负面舆情新闻数单元、发帖数量单元、参与发帖人数单元、阅读次数单元、评论次数单元、转发次数单元、分享次数单元、收藏次数单元、负面关联词语单元、正面关联词语单元、中性关联词语单元、关联词语词频单元。2.根据权利要求1所述的宏观经济指标舆情数据库,其特征在于:将舆情的文本数据通过计算转化为数值类型的数据,建立舆情数值型数据库,实现舆情文本数据的数值化转化;所述计算方式包括:判别分析,分组计数,关联分析,其中判别分析用逻辑回归模型判别新闻正负面,分组统计用于对舆情来源,类型进行分组,然后统计频次,关联分析用于通过对词语的共线,词频相似度分析得到词语之间的关联关系。3.根据权利要求1所述的宏观经济指标舆情数据库,其特征在于:所述国民经济核算单元包括第一产业、农林牧渔业、第二产业、工业增加值、建筑业、第三产业、交通运输业、邮政业、批发业、住宿业、餐饮业、金融业、房地产业、仓储业、居民消费水平、农村居民消费水平、城镇消费水平;所述人口单元包括全国总人口、男性人口、女性人口、城镇、乡村、出生率、死亡率、自然增长率、流动、普查、抽样调查;所述就业人员和职工工资单元包括就业人员数、职工工资、工资总额、城镇平均工资、农村失业人数、国有单位失业率、私营企业劳动报酬、港澳台商投资单位工资指数、外商投资单位平均工资指数、个体户平均货币工资指数、农





渔业平均实际工资指数、采掘业、制造业、交通运输、仓储和邮政业、批发零售贸易和餐饮业、批发和零售业、住宿和餐饮业、租赁和商务服务业、居民服务和其他服务业、社会服务业、城镇投资者人数、乡村投资者人数。4.根据权利要求1所述的宏观经济指标舆情数据库,其特征在于:所述固定资产投资单元包括全社会固定资产投资的固定资产投资总额、民间固定资产投资的固定资产建设总规模、城镇固定资产投资的住宅投资、第一产业固定资产投资、第二产业固定资产投资、第三产业固定资产投资、房地产开发企业和销售面积;所述对外经济贸易单元包括进出口贸易和对外经济合作,所述进出口贸易包括进出口总额、出口总额、进口总额、进出口差额、出口货物、进口货物、货物进出口和外商投资企业货物进出口总额。5.根据权利要求1所述的宏观经济指标舆情数据库,其特征在于:所述能源单元包括能源生产、能源消费、石油的可供量、煤炭的生产量、电力、能源加工转换效率,所述能源生产包括生产总量、原煤比重、原油比重、天然气比重、水电比重、核电比重和风电比重,所述电力包括进口量、出口量、消费量、平衡差额、能源生产弹性系数和能源消费弹性系数;所述能源加工转换效率包括发电及电站供热转换效率、炼焦转换效率和炼油转换效率。
6.根据权利要求1所述的宏观经济指标舆情数据库,其特征在于:所述财政单元包括国家财政收入、国家财政支出和国家债务,所述国家财政收入包括财政收入占比、税收和非税收收入,所述税收包括增值税、营业税、外贸企业出口退税、资源税、城市维护建设税、企业所得税、个人所得税、城镇土地使用税、契税、烟叶税、耕地占用税、证券交易印花税、房产税、印花税、土地增值税和车船税,所述非税收收入包括专项收入、行政事业性收费、罚...

【专利技术属性】
技术研发人员:孙琴
申请(专利权)人:北京搜知数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1