【技术实现步骤摘要】
一种企业经营业绩预测先行指标筛选方法及系统
[0001]本专利技术涉及指标筛选
,尤其涉及一种企业经营业绩预测先行指标筛选方法及系统。
技术介绍
[0002]在预测上市公司业绩时,往往需要用到宏观指标、行业数据指标,市场上可以采购到的宏观指标和行业数据指标数量级庞大(几十万条,甚至上百万条),传统人工筛选的方法需要消耗大量的人力,并且需要筛选的人员对上市公司业务情况及宏观、行业指标有非常深入的研究和了解,但受限于人注意力和精力有限,因此在筛选时往往可能漏掉很多高价值的宏观、行业先行指标;或者随着时间推移和上市公司经营范围的变化,上市公司经营业绩的先行指标也会发生变化,因此需要一种新型的利用计算机高效、相对准确的筛选上市公司经营业绩预测先行指标的筛选方法。
技术实现思路
[0003]有鉴于此,本申请实施例提供了一种企业经营业绩预测先行指标筛选方法。
[0004]第一方面,本申请实施例提供了一种企业经营业绩预测先行指标筛选方法,包括:
[0005]获取目标企业的研报图表和营业收入,并从所述研 ...
【技术保护点】
【技术特征摘要】
1.一种企业经营业绩预测先行指标筛选方法,其特征在于,包括:获取目标企业的研报图表和营业收入,并从所述研报图表中提取研报关键词,对所述研报关键词进行计算得到所述研报关键词向量;从行业数据库中获取所述目标企业所属行业的宏观指标和产业指标;并从所述宏观指标和产业指标中获取指标关键词,对所述指标关键词进行计算得到指标词向量;确定所述研报关键词向量与所述指标词向量的逻辑相关性;获取所述宏观指标和产业指标的指标值,并确定所述指标值与所述营业收入的数学相关性;根据所述逻辑相关性和数学相关性确定各指标的综合相关性,并根据所述综合相关性确定相关指标列表;对所述相关指标列表中的指标进行去共线性分析,得到所述目标企业的前瞻指标。2.根据权利要求1所述的方法,其特征在于,所述从所述研报文件中提取研报关键词包括:通过字符识别技术得到所述研报图表中的文字信息;针对所述研报图表中的文字信息,通过分词、词频统计和词性分析得到所述研报图表中的关键词。3.根据权利要求2所述的方法,其特征在于,通过字符识别技术得到所述研报图表中的文字信息包括:针对目标企业的研报图表,通过OCR技术,得到所述目标企业研报图表中的文字信息,其中判定标准为识别准确率大于等99.9%。4.根据权利要求1所述的方法,其特征在于,所述对所述研报关键词进行计算得到研报关键词向量包括:获取所述研报关键词在所有研报图表中的出现频率和上下文的共现频率;根据所述出现频率和上下文的共现频率确定所述研报关键词向量。5.根据权利要求1所述的方法,其特征...
【专利技术属性】
技术研发人员:周纯葆,王彦棡,王珏,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。