【技术实现步骤摘要】
基于财务凭证数据的公司分类方法、计算机可读介质
[0001]本申请属于财务凭证数据处理
,具体涉及基于财务凭证数据的公司分类方法、计算机可读介质。
技术介绍
[0002]现有技术中,通常根据公司规模或业务范围对公司进行分类,分类方法具有一定主观性,缺乏客观性,对公司的分类结果没有实际参考意义。
技术实现思路
[0003]有鉴于此,一方面,一些实施例公开的技术方案是基于财务凭证数据的公司分类方法。具体地,基于财务凭证数据的公司分类方法包括步骤:
[0004]S1:对单一公司的原始财务凭证明细数据进行分组处理,得到关于科目月度发生金额的第一样本数据和关于记账频次的第二样本数据,其中第一样本数据的列索引包括时间、科目和借贷标识三个维度,第二样本数据的列索引包括时间、科目和借贷标识三个维度;
[0005]S2:汇总所有公司的第一样本数据得到第一总样本数据,汇总所有公司的第二样本数据得到第二总样本数据;
[0006]S3:合并所有公司的第一总样本数据和第二总样本数据,得到所有公司的初始样本 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.基于财务凭证数据的公司分类方法,其特征在于,该方法包括步骤:S1:对单一公司的原始财务凭证明细数据进行分组处理,得到关于科目月度发生金额的第一样本数据和关于记账频次的第二样本数据,其中所述第一样本数据的列索引包括时间、科目和借贷标识三个维度,所述第二样本数据的列索引包括时间、科目和借贷标识三个维度;S2:汇总所有公司的第一样本数据得到第一总样本数据,汇总所有公司的第二样本数据得到第二总样本数据;S3:合并所有公司的所述第一总样本数据和所述第二总样本数据,得到所有公司的初始样本数据;S4:根据预设的分类数,确定与分类数量相等的聚类初始中心点;S5:根据分类数、聚类初始中心点、初始样本数据进行分类,确定每一个分类的聚类标签和每一个分类包含的公司。2.根据权利要求1所述的基于财务凭证数据的公司分类方法,其特征在于,所述步骤S1中,所述第一样本数据为(1*n)阶矩阵,所述第二样本数据为(1*n)阶矩阵,其中n为列索引数目,为自然数。3.根据权利要求1所述的基于财务凭证数据的公司分类方法,其特征在于,所述步骤S2中,所述第一总样本数据为(m*N)阶矩阵,所述第二总样本数据为(m*N)阶矩阵,其中,m为公司数量,N为列索引数目,等于所有公司的列索引并集中的列索引数目,m、N均为自然数。4.根据权利要求3所述的基于财务凭证数据的公司分类方法,其特征在于,所述步骤S3中,对所述第一总样本数据和所述第二总样本数据进行标准化处理后,进行列合并,得到初始样本数据(m*2N)阶矩阵,其中,m为公司数量,2N为列索引总数。5.根据权利要求1所述的基于财务凭证数据的公司分类方法,其特征在于,所述步骤S4中,预设分类数为k,确定聚类初始中心点具体包括:S401:计算第一总样本数据中每个公司的所有列索引所对应的数据的平方和,将所述平方和的值最大的公司作为第一个聚类初始中心点,并将其对应的样本数据移出初始样本数据;S402:计算步骤S401中移出第一个聚类初始中心点的样本数据后的初始样本数据中,每个公司的样本数据与第一个聚类初始中心点的样本数据之间的距离,将所述距离最大的公司作为第二个聚类初始中心点,并将其对应的样本数据移出初始样本数据;S403:计算步骤S402中移出第二个聚类初始中心点的样本数据后的总样本数据中,每个公司的样本数据分别与第一个聚类初始中心点和第二个聚类初始中心点的样本数据之间的距离,将所述距离最大的公司作为第三个聚类初始中心,并将其对应的样本数据移出初始样本数据;S404:依次此类推,得到与分类数量k相等的k个聚类算法初始中心点,形成聚类算法初始中心点集合。6.根据权利要求4所述的基于财务凭证数据的公司分类方法,其特征在于,所述步骤S4中,预设分类数为k,确定聚类初始中心点具体包括:S401:计算第一总样本数据(m*N)阶矩阵中,每个公司的所有列索引所对应的数据的平方和Pi,将所述Pi值最大的公司作为第一个聚类初始中心点,并将其对应的样本数据(1*
2N)阶矩阵移出初始样本数据,初始样本数据变为(m
‑
1*2N)阶矩阵;其中,所述Pi的计算公式为:式中,x
i
y
l
表示第一总样本数据(m*N)矩阵中第i行第l列对应的数据,l为从1到N的自然数,i为1~m的自然数;S402:计算初始样本数据(m
‑
1*2N)阶矩阵中,每个公司的样本数据与第一个聚类初始中心点的样本数据(1*2N)阶矩阵之间的距离,将所述距离最大的公司作为第二个聚类初始中心点,并将其对应的样本数据(1*2N)阶矩阵移出初始样本数据,初始样本数据变为(m
‑
2*2N)阶矩阵;其中,所述距离L1‑
i
的计算公式为:式中,x1y
技术研发人员:戴悦,王耀左,
申请(专利权)人:中远海运科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。