【技术实现步骤摘要】
一种数据处理方法、装置和设备
本专利技术涉及股票指数编制领域,特别涉及一种数据处理方法、装置和设备。
技术介绍
大数据已经渗透到当今每个行业和业务功能区域,成为一个重要的生产要素。随着大数据的价值越来越显著,其在各个领域的作用也越来越重要。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,通过对数据的“加工”实现数据的“增值”。经过几年发展,金融行业应用大数据的案例越来越多,股票指数编制就是其中比较成熟的一种,类似中证淘金大数据100指数,南方新浪大数据指数和中证百度百发策略100指数等。然而,上述指数在编制时,样本股选取及权重的分配的依据主要源自上市公司的定期报告,这些定期报告披露时间相比财务年度要晚一至四个月且只有等所有样本公司定期报告披露完全才能重新选样以及计算权重,并且定期报告中的数据不全面、不精准,因此现有指数编制时的参考数据并不能完全代表实际情况,并且现有的指数编制时通常采用等权重计算方式,因此也不能很好的考虑到每一样本股的实际情况。
技术实现思路
>有鉴于此,本专利技本文档来自技高网...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n在预设的时间段内选取与商品品类相对应的所有样本股,生成样本股集合,判断所述样本股集合中样本股的数量是否大于预设值;/n若所述样本股集合中样本股的数量大于预设值,则即时爬取与所述商品品类相对应的每一样本股的价格、流通股本数、计价货币相对于人民币的汇率以计算每一样本股的流通市值,同时爬取与每一样本股相对应的销售数据,并根据所述销售数据计算每一样本股的加权比例;/n基于每一样本股的流通市值和加权比例,计算所述样本股集合的总流通市值;/n将所述样本股集合的总流通市值与预先计算好的一基准值进行比较,得到所述样本股集合的指数。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
在预设的时间段内选取与商品品类相对应的所有样本股,生成样本股集合,判断所述样本股集合中样本股的数量是否大于预设值;
若所述样本股集合中样本股的数量大于预设值,则即时爬取与所述商品品类相对应的每一样本股的价格、流通股本数、计价货币相对于人民币的汇率以计算每一样本股的流通市值,同时爬取与每一样本股相对应的销售数据,并根据所述销售数据计算每一样本股的加权比例;
基于每一样本股的流通市值和加权比例,计算所述样本股集合的总流通市值;
将所述样本股集合的总流通市值与预先计算好的一基准值进行比较,得到所述样本股集合的指数。
2.根据权利要求1所述的方法,其特征在于,爬取与每一样本股相对应的销售数据,并根据所述销售数据计算每一样本股的加权比例具体包括:
按照预设的分析维度对所述销售数据进行清洗、分析,得到每一样本股的与每一分析维度相对应的数据;
获取与每一分析维度相对应的计算规则,根据与每一分析维度相对应的计算规则对相应分析维度的数据进行计算,得到每一样本股的与每一分析维度相对应的影响因子;
基于每一样本股的与每一分析维度相对应的影响因子,计算每一样本股的加权比例。
3.根据权利要求2所述的方法,其特征在于,所述预设的分析维度包括上市公司成长性维度;其中,每一上市公司由所述商品品类下的商品映射得到且每一上市公司对应一样本股;
所述按照预设的分析维度对所述销售数据进行清洗、分析,得到每一样本股的与每一分析维度相对应的数据具体包括:
按照所述上市公司成长性维度对所述销售数据进行清洗,确定所述上市公司的所述商品品类下的商品的销量、价格、所述商品在线上平台的搜索量、与所述商品属于同一商品品类的其他商品在线上平台的总搜索量;
根据所述商品的上架时间以及预设的时间窗口对所述商品进行分析,确定新商品和旧商品;
根据所述商品的销量和价格,确定所述新商品在一预设的月度相对于所述月度的上一月度的销售变化额和所述旧商品在对应的月度相对于所述月度的上一月度的销售变化额;
将所述新商品在一预设的月度相对于所述月度的上一月度的销售变化额、所述旧商品在对应的月度相对于所述月度的上一月度的销售变化额、所述商品在线上平台的搜索量、与所述商品属于同一商品品类的其他商品在线上平台的总搜索量确定为与所述上市公司成长性维度相对应的数据。
4.根据权利要求3所述的方法,其特征在于,所述预设的分析维度还包括上市公司与线上平台依赖性维度;
所述按照预设的分析维度对所述销售数据进行清洗、分析,得到每一样本股的与每一分析维度相对应的数据具体包括:
按照所述上市公司与线上平台依赖性维度对所述销售数据进行清洗、分析,得到所述上市公司发布的所述商品品类下的商品在每一预设时间统计得到的在线上平台销售收入、所述上市公司发布的所述商品品类下的商品在每一预设时间统计得到的在线上平台和线下平台销售收入。
5.根据权利要求1所述的方法,其特征在于,在预设的时间段内选取与商品品类相对应的所有样本股具体包括:
在预设的时间段内获取所述商品品类下的所有商品映射的上市公司所对应的股票;
获取每一股票所属的上一级商品品类;
计算每一股票的第一占比和第二占比,其中,所述第一占比为每一股票的上一级商品品类下的所有商品的线上平台销售和线下平台销售年收入与所述股票所对应的上市公司的年收入的比值,所述第二占比为所述股票的商品品类下的所有商品的线上平台销售年收入与所述股票的上一级商品品类所对应的所有商品的线上平台销售年收入的比值;
将所述每一股票的第一占比和第二占比相乘,并将相乘结果满足第一预设条件且第二占比满足第二预设条件时所对应的股票确定为样本股。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在非预设的时间段内,将当前获取到的所述商品品类下的所有商品与所述样本股集合中的所有样本股对应的所有商品进行比较,确定当前获取到的所述商品品类下的所有商品中与所述样本股集合中的所有样本股对应的所有商品相不同的商品,将不同的商品确定为新商品;
当所述新商品映射的公司为上市公司时,将所述新...
【专利技术属性】
技术研发人员:陆立力,张侦,潘光远,
申请(专利权)人:苏宁金融科技南京有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。