一种基于语义匹配方法的财务科目自动识别方法及装置制造方法及图纸

技术编号：24411082 阅读：23 留言：0更新日期：2020-06-06 09:14

本发明专利技术公开了一种基于语义匹配方法的财务科目自动识别方法，包括：通过专家经验整理标准科目的匹配库；通过大量匹配语料训练科目匹配模型，根据相似度找到与原始科目最相似的标准问答库的原始科目名并返回所对应的标准科目名。实施上述方法的装置，包括：用于通过专家经验整理的原始科目对应的标准科目模块；利用深度学习训练语义匹配模型模块；通过匹配模型返回匹配的原始科目及返回对应的标准科目模块；最后通过专家经验对科目进行校准。本发明专利技术利用深度学习模型以将财务科目进行精确匹配成标准科目。

An automatic recognition method and device of financial account based on semantic matching

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义匹配方法的财务科目自动识别方法及装置
本专利技术涉及自动识别
，具体是一种基于语义匹配方法的财务科目自动识别方法及装置。
技术介绍
近年来，深度学习技术在自然语言处理、图形图像、自动驾驶等多个领域得到大量应用，且表现效果要明显优于传统方法。在自然语言处理领域，深度学习技术通过在高维空间中编码文本文字，能够捕获深层次的语法和语义信息，从而为进一步从语义出发实现自然语言处理领域的高级应用提供了技术基础。在财务报表结构化入库之后，为了便于进行文表和表表之间的勾稽关系，有必要将表达不同但具有相同财务意义的科目名归一成一个标准的科目名。于是我们开发了基于语义匹配方法的财务科目自动识别的装置。
技术实现思路
本专利技术的目的在于提供一种基于语义匹配方法的财务科目自动识别方法及装置，以解决上述
技术介绍
中提出的问题。为实现上述目的，本专利技术提供如下技术方案：一种基于语义匹配方法的财务科目自动识别方法，包含以下步骤：A、通过专家经验总结建立科目匹配的标准匹配库；B、利用深度学习训练科目匹配模型；C、通过匹配模型返回标准科目名；D、通过表名进行科目名校正。作为本专利技术的进一步方案：所述步骤A中的建立标准匹配库在于将表格结构化入库的科目名通过专家经验配上标准科目名，对入库的科目进行简单预处理，去除特殊字符，同一中英文标点符号，形成标准的匹配库。作为本专利技术的进一步方案：所述步骤B中的训练科目匹配模型是基于百度的Any...

【技术保护点】
1.一种基于语义匹配方法的财务科目自动识别方法，其特征在于，包含以下步骤：/nA、通过专家经验总结建立科目匹配的标准匹配库；/nB、利用深度学习训练科目匹配模型；/nC、通过匹配模型返回标准科目名；/nD、通过表名进行科目名校正。/n

【技术特征摘要】
1.一种基于语义匹配方法的财务科目自动识别方法，其特征在于，包含以下步骤：
A、通过专家经验总结建立科目匹配的标准匹配库；
B、利用深度学习训练科目匹配模型；
C、通过匹配模型返回标准科目名；
D、通过表名进行科目名校正。

2.根据权利要求1所述的一种基于语义匹配方法的财务科目自动识别方法，其特征在于，所述步骤A中的建立标准匹配库在于将表格结构化入库的科目名通过专家经验配上标准科目名，对入库的科目进行简单预处理，去除特殊字符，同一中英文标点符号，形成标准的匹配库。

3.根据权利要求1所述的一种基于语义匹配方法的财务科目自动识别方法，其特征在于，所述步骤B中的训练科目匹配模型是基于百度的AnyQ框架，训练的一个simnet网络模型。

4.根据权利要求2所述的一种基于语义匹配方法的财务科目自...

【专利技术属性】
技术研发人员：李鹏辉，金鑫，邱锡鹏，
申请(专利权)人：上海犀语科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人