一种银行交易记录分类方法技术

技术编号:37322863 阅读:11 留言:0更新日期:2023-04-21 23:02
本申请公开了一种银行交易记录分类方法,涉及交易分类技术领域,该方法通过抓取消费区域内的消费场所构建得到对应于消费区域的区域语料库,继而训练得到消费区域的区域分词模型,然后基于每个客户在预定历史时段内的历史全量交易记录确定客户对应的消费区域,并利用消费区域的区域分词模型对客户的银行交易记录的交易描述文本进行分词处理后输入交易分类模型得到对银行交易记录的分类结果。该方法基于消费区域的消费场所和银行业务名词构建不同的区域分词模型,从而更符合消费区域的商户信息和银行业务需求,相比于基于传统普通语料库进行分词的做法优化了分词逻辑,使得分词结果更准确,从而使得对银行交易记录的分类更准确。准确。准确。

【技术实现步骤摘要】
一种银行交易记录分类方法


[0001]本申请涉及交易分类
,尤其是一种银行交易记录分类方法。

技术介绍

[0002]目前,线上交易已经全面渗透进大众生活,产生的线上的交易记录出现了爆发式增长,通过对这些交易记录进行分类,并对分类后的交易记录采用大数据和人工智能等技术进行数据分析,可以衍生出一系列有价值的新数据,比如终端商户的交易偏好或消费者的交易偏好,从而可以对不同的终端商户或消费者提供针对性服务。
[0003]对交易记录的分类准确性直接影响了后续数据分析的效果,现有的交易记录的分类方法主要是基于交易记录中的交易描述信息进行分类,但是很多交易描述信息中的关键词与通用的交易类别之间的关联度较低,往往出现难以分类或者分类错误的问题,导致交易分类准确度较低。

技术实现思路

[0004]本申请人针对上述问题及技术需求,提出了一种银行交易记录分类方法,本申请的技术方案如下:
[0005]一种银行交易记录分类方法,该方法包括:
[0006]针对任意一个消费区域,抓取消费区域内的消费场所构建得到消费区域的区域语料库;
[0007]基于消费区域的区域语料库利用消费区域的区域历史全量交易记录的交易描述文本训练得到消费区域的区域分词模型;
[0008]基于每个客户在预定历史时段内的历史全量交易记录确定客户对应的消费区域,并利用消费区域的区域分词模型对客户的银行交易记录的交易描述文本进行分词处理;
[0009]将每个客户的银行交易记录的分词结果输入预先训练的交易分类模型得到对银行交易记录的分类结果。
[0010]其进一步的技术方案为,确定每个客户对应的消费区域的方法包括:
[0011]获取客户在预定历史时段内的历史全量交易记录并对交易地点进行标注,并对所有历史全量交易记录的交易地点进行聚类处理,根据聚类结果确定客户对应的消费区域。
[0012]其进一步的技术方案为,对客户的历史全量交易记录的交易地点进行标注的方法包括:
[0013]基于客户的个人信息确定客户的基础地址范围,在基础地址范围内对客户的历史全量交易记录的交易地点进行标注。
[0014]其进一步的技术方案为,基于客户的个人信息确定客户的基础地址范围包括将客户的个人信息记载的居住地址、工作地址和户籍地址所在的预定覆盖范围内的区域作为客户的基础地址范围。
[0015]其进一步的技术方案为,根据聚类结果确定客户对应的消费区域的方法包括:
[0016]利用密度最大值聚类法对所有历史全量交易记录的交易地点聚类得到若干个簇,确定最大的簇的边界区域所属的消费区域得到客户对应的消费区域。
[0017]其进一步的技术方案为,该方法还包括:
[0018]汇总客户在预定时间区间内的银行交易记录的分类结果,得到客户对应于每个交易类别的统计数据,每个交易类别的统计数据包括预定时间区间内属于交易类别的银行交易记录的交易笔数和交易金额。
[0019]其进一步的技术方案为,该方法还包括:
[0020]计算客户的每个交易类别的交易笔数占预定时间区间内的所有银行交易记录的总交易笔数的比例,得到每个交易类别的交易笔数占比;
[0021]计算客户的每个交易类别的交易金额占预定时间区间内的所有银行交易记录的总交易金额的比例,得到每个交易类别的交易金额占比;
[0022]对客户的每个交易类别的交易笔数占比和交易金额占比进行加权计算得到各个交易类别的偏好值,偏好值越高、指示客户对交易类别的偏好程度越高。
[0023]其进一步的技术方案为,该方法还包括:
[0024]利用每个消费区域的区域分词模型对消费区域的区域历史全量交易记录的交易描述文本进行分词处理,得到各个历史全量交易记录的分词结果,对各个历史全量交易记录所属的交易类别进行标注,构建得到训练样本集;
[0025]以历史全量交易记录的分词结果为输入、交易类别为输出,利用训练样本集基于朴素贝叶斯算法进行分类拟合,训练得到交易分类模型。
[0026]本申请的有益技术效果是:
[0027]本申请公开了一种银行交易记录分类方法,该方法基于消费区域的消费场所和银行业务名词构建不同的区域分词模型,从而更符合消费区域的商户信息和银行业务,相比于基于传统普通语料库进行分词的做法优化了分词逻辑,使得分词结果更准确,从而使得对银行交易记录的分类更准确。
附图说明
[0028]图1是本申请一个实施例的种银行交易记录分类方法的方法流程图。
具体实施方式
[0029]下面结合附图对本申请的具体实施方式做进一步说明。
[0030]本申请公开了一种银行交易记录分类方法,请参考图1所示的流程图,该方法包括如下步骤:
[0031]步骤1,针对任意一个消费区域,抓取该消费区域内的消费场所构建得到消费区域的区域语料库。每个消费区域覆盖的范围可以自定义,比如一般可以选取一个地级市范围作为一个消费区域,通过地图API按照消费区域的地点类别进行抓取,即可以构建得到区域语料库。
[0032]步骤2,基于每个消费区域的区域语料库利用该消费区域的区域历史全量交易记录的交易描述文本训练得到消费区域的区域分词模型。
[0033]不同的消费区域内包含不同的消费场所,有些消费场所的名称并不具有明确的导
向性,可能与常规用词较为接近,在按照普通分词方法进行分词时会容易出现误识别的现象,导致分词错误,最终导致后续分类错误,所以需要构建基于消费区域内的消费场所的区域分词模型。而部分消费场所具有地域性,有些消费场所可能只在部分消费区域中存在,所以需要针对不同的消费区域建立不同的区域分词模型。
[0034]另外在训练区域分词模型时,还基于银行业务名词增加停止词和学习词,如支付宝、江湖平台、违约金等,从而基于银行业业务专有名词优化分词逻辑、
[0035]步骤3,基于每个客户在预定历史时段内的历史全量交易记录确定客户对应的消费区域,并利用对应的消费区域的区域分词模型对客户的银行交易记录的交易描述文本进行分词处理。
[0036]如上所述,不同消费区域的区域分词模型基于相应消费区域内的消费场所的信息构建得到,是符合消费区域的特点的,所以在对一个客户的银行交易记录进行分词处理时,需要确定使用哪一个消费区域的区域分词模型进行分词处理,在一个实施例中,确定客户对应的消费区域包括如下步骤:
[0037](1)获取客户在预定历史时段内的历史全量交易记录并对交易地点进行标注。仅仅凭借历史全量交易记录的交易描述文本通常难以准确的对其交易地点进行标注,因此基于客户的个人信息确定客户的基础地址范围,包括将客户的个人信息记载的居住地址、工作地址和户籍地址所在的预定覆盖范围内的区域作为客户的基础地址范围。然后在基础地址范围内对客户的历史全量交易记录的交易地点进行标注。
[0038](2)对所有历史全量交易记录的交易地点进行聚类处理。在一个实施例中,利用密度最大值聚类法对所有历史全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种银行交易记录分类方法,其特征在于,所述方法包括:针对任意一个消费区域,抓取所述消费区域内的消费场所构建得到所述消费区域的区域语料库;基于所述消费区域的区域语料库利用所述消费区域的区域历史全量交易记录的交易描述文本训练得到所述消费区域的区域分词模型;基于每个客户在预定历史时段内的历史全量交易记录确定所述客户对应的消费区域,并利用所述消费区域的区域分词模型对所述客户的银行交易记录的交易描述文本进行分词处理;将每个客户的银行交易记录的分词结果输入预先训练的交易分类模型得到对所述银行交易记录的分类结果。2.根据权利要求1所述的方法,其特征在于,确定每个客户对应的消费区域的方法包括:获取所述客户在预定历史时段内的历史全量交易记录并对交易地点进行标注,并对所有历史全量交易记录的交易地点进行聚类处理,根据聚类结果确定所述客户对应的消费区域。3.根据权利要求2所述的方法,其特征在于,对客户的历史全量交易记录的交易地点进行标注的方法包括:基于所述客户的个人信息确定所述客户的基础地址范围,在所述基础地址范围内对客户的历史全量交易记录的交易地点进行标注。4.根据权利要求3所述的方法,其特征在于,基于所述客户的个人信息确定所述客户的基础地址范围包括将所述客户的个人信息记载的居住地址、工作地址和户籍地址所在的预定覆盖范围内的区域作为所述客户的基础地址范围。5.根据权利要求2所述的方法,其特征在于,根据聚类结果确定所述客户对应的消费区域的方法包括...

【专利技术属性】
技术研发人员:胡誉馨姜玉麟周亮郁瑞澜
申请(专利权)人:无锡农村商业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1