银行流水打标方法及装置制造方法及图纸

技术编号：38766063 阅读：17 留言：0更新日期：2023-09-10 10:39

本发明专利技术公开了一种银行流水打标方法及装置，该方法包括：从历史银行流水中挖掘实体词，通过分类模型为新挖掘的实体词打上标签，并加入实体词库；在获得新的银行流水后，基于新的银行流水的实体词与实体库中实体词匹配，获得匹配结果；根据匹配结果，选择对应的打标模型对新的银行流水进行打标。本发明专利技术可以提高银行流水打标的精度。流水打标的精度。流水打标的精度。

全部详细技术资料下载

【技术实现步骤摘要】
银行流水打标方法及装置

[0001]本专利技术涉及人工智能
，尤其涉及一种银行流水打标方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]银行交易流水订单指发生交易时产生的订单，如进行柜台取现、ATM取现存款、基金理财购买、手机支付等交易时产生的订单。每一笔交易都会涉及到两方：交易方（一般是行方客户）和交易对手方。银行交易流水订单保存有交易双方的交易信息，包括账号信息、交易对手双方的名称、交易附言等信息。如客户去超市使用手机支付买了一瓶饮料，则客户是交易方，超市是交易对手方，饮料是商品信息，手机支付是交易方式。理想情况是知道交易方、交易对手方和商品的信息，如交易方和交易对手方都是行方的客户。将这些流水订单进行分类，以标识资金用途和类别，供后续基于客户维度的面向营销或者风险等专题的分析使用。
[0004]目前对银行流水进行标注的方案包括文本分类机器学习方法，例如基于sklearn实现的垃圾邮件分类算法，包括朴素贝叶斯、SVM、逻辑回归、RF、XGBoost、LightGBM等。但是一般进行标注时采用上述单一的算法，分类精度有待提高。

技术实现思路

[0005]本专利技术实施例提供一种银行流水打标方法，用以提高银行流水打标的精度，该方法包括：从历史银行流水中挖掘实体词；通过分类模型为新挖掘的实体词打上标签，并加入实体词库；在获得新的银行流水后，基于新的银行流水的实体词与实体库

【技术保护点】

【技术特征摘要】
1.一种银行流水打标方法，其特征在于，包括：从历史银行流水中挖掘实体词；通过分类模型为新挖掘的实体词打上标签，并加入实体词库；在获得新的银行流水后，基于新的银行流水的实体词与实体库中实体词匹配，获得匹配结果；根据匹配结果，选择对应的打标模型对新的银行流水进行打标。2.如权利要求1所述的方法，其特征在于，从历史银行流水中挖掘实体词，包括：收集预设时段内的历史银行流水；对每个历史银行流水，提取预设文本类型的字段，所述预设文本类型包括摘要、附言、备注、交易对手名称中的其中之一或任意组合；分别对预设文本类型的字段进行去重并进行预处理，获得文本数据；根据所述文本数据和挖掘模型，获得实体词。3.如权利要求2所述的方法，其特征在于，根据所述文本数据和挖掘模型，获得实体词，包括：根据所述文本数据和挖掘模型，获得候选实体词；对所述候选实体词进行后处理；对后处理后的实体词进行核验；将通过核验的实体词作为挖掘的实体词。4.如权利要求3所述的方法，其特征在于，根据所述文本数据和挖掘模型，获得候选实体词，包括：使用Python构建PhraseMining模型；将所述文本数据输入至PhraseMining模型，获得候选实体词。5.如权利要求3所述的方法，其特征在于，根据所述文本数据和挖掘模型，获得候选实体词，包括：使用分词技术库对文本数据进行中文分词，获得分词数据；使用word2vec算法构建Word2vec模型；使用所述分词数据和Word2vec模型，训练词向量；利用训练好的词向量，计算词与词之间的相似度；根据所述相似度，找出实体词库中词的近义词，作为候选实体词。6.如权利要求1所述的方法，其特征在于，在通过分类模型为新挖掘的实体词打上标签之后，还包括：接收人工对新挖掘的实体词的标签的审核结果；在审核结果为打标正确时，将打标正确的实体词加入实体词库中。7.如权利要求...

【专利技术属性】
技术研发人员：刘军杰，康科，樊雨，
申请(专利权)人：山景智能北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人