财务分类方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:37131446 阅读:36 留言:0更新日期:2023-04-06 21:29
本发明专利技术提供了一种财务分类方法、装置、电子设备及计算机可读存储介质,涉及数据处理技术领域,在进行财务分类时,先获取会计凭证数据,会计凭证数据包括多个会计凭证;再基于TF

【技术实现步骤摘要】
财务分类方法、装置、电子设备及计算机可读存储介质


[0001]本专利技术涉及数据处理
,尤其是涉及一种财务分类方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]目前电子会计档案系统的会计凭证模块中会接入法人实体企业的全部会计凭证数据,一般一个月会有数万到数十万数据量不等,一年差不多数十万到百万级数据。一个企业数年的会计凭证数据量达到数百万到上千万数量级别。
[0003]会计凭证是公司财务现金流走向的重要数据,一般财务人员检查会计凭证数据,只能通过摘要、科目等一些会计关键字来进行数据搜索,对于会计凭证数据的分类,通常需要财务人员根据会计凭证的格式化数据的关键字进行手工分类。这种方式下,不便于财务人员查看会计凭证,人工成本较高,且容易出现人工操作失误的情况。

技术实现思路

[0004]本专利技术的目的在于提供一种财务分类方法、装置、电子设备及计算机可读存储介质,以方便财务人员分类查看会计凭证,降低人工成本,避免人工操作失误问题。
[0005]第一方面,本专利技术实施例提供了一种财务分类方法,包括本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种财务分类方法,其特征在于,包括:获取会计凭证数据,所述会计凭证数据包括多个会计凭证;基于TF

IDF算法,将所述会计凭证数据中的每个会计凭证转换为相应的词向量;对所述会计凭证数据对应的各个词向量进行聚类分析,得到所述会计凭证数据的财务分类结果。2.根据权利要求1所述的财务分类方法,其特征在于,所述基于TF

IDF算法,将所述会计凭证数据中的每个会计凭证转换为相应的词向量的步骤,包括:对所述会计凭证数据中的每个会计凭证进行分词,得到每个所述会计凭证的分词结果;根据各个所述会计凭证的分词结果,计算所述会计凭证数据中每个词语的TF

IDF值;根据所述会计凭证数据中每个词语的TF

IDF值和每个所述会计凭证的分词结果,将每个所述会计凭证转换为相应的词向量。3.根据权利要求2所述的财务分类方法,其特征在于,所述根据所述会计凭证数据中每个词语的TF

IDF值和每个所述会计凭证的分词结果,将每个所述会计凭证转换为相应的词向量的步骤,包括:根据所述会计凭证数据中每个词语的TF

IDF值,从所述会计凭证数据的各个词语中筛选出关键词;根据所述关键词的TF

IDF值和每个所述会计凭证的分词结果,生成每个所述会计凭证的词向量。4.根据权利要求1所述的财务分类方法,其特征在于,所述对所述会计凭证数据对应的各个词向量进行聚类分析,得到所述会计凭证数据的财务分类结果的步骤,包括:随机选择第一预设数量个所述会计凭证的词向量作为聚类中心;通过如下步骤进行迭代:将各个所述会计凭证的词向量分到相应聚类中心对应的类别中;根据每个所述类别中的各个词向量,更新每个所述类别的聚类中心;当迭代次数达到预设次数时,将当前的聚类结果作为所述会计凭证数据的财务分类结果。5.根据权利要求4所述的财务分类方法,其特征在于,所述将各个所述会计凭证的...

【专利技术属性】
技术研发人员:肖建伟柴晓男
申请(专利权)人:北京合思信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1