一种识别商户类型的方法及装置制造方法及图纸

技术编号:24169037 阅读:54 留言:0更新日期:2020-05-16 02:21
本发明专利技术提供一种识别商户类型的方法及装置,从交易信息中获取商户的商户名称;通过商户名称与各商户类型的预设词表的匹配,确定商户对应的第一商户类型;各商户类型的预设词表包括每个商户类型对应的多个词分类下的各词语;若确定第一商户类型存在相似的第二商户类型,则将该交易信息输入相似商户分类模型,相似商户分类模型是由第一商户类型所对应的历史交易信息与第二商户类型所对应的历史交易信息训练得到的;获取由相似商户分类模型输出的第三商户类型;确定第三商户类型为商户所属的商户类型。该方案通过将商户的商户名称与各商户类型的预设词表进行匹配、以及进行相似商户分类的判断,有助于准确地识别商户的商户类型。

A method and device to identify merchant type

【技术实现步骤摘要】
一种识别商户类型的方法及装置
本专利技术涉及数据分析领域,尤其涉及一种识别商户类型的方法及装置。
技术介绍
目前,通过分析持卡人的交易数据、识别持卡人的消费偏好,有助于银行对持卡人开展精准营销活动。其中,在识别持卡人的消费偏好时,一方面是基于持卡人消费过的商户类型的相关数据,但是由于商户在POS机注册时将商户类型的错填,以及商户在实际经营过程中的业务改变、但未更改POS机的商户类型的信息,因此仅仅使用未校正的商户类型作为识别持卡人的消费偏好的依据,则很大程度上会产生误差;另一方面,在计算持卡人的消费偏好时普遍根据持卡人在某个消费类型上的金额频次来定义该持卡人的消费偏好,而未考虑与其他持卡人的对比,因此也会造成对持卡人的消费偏好的错误判断。现有技术一般通过商户名称以及商户交易数据来确定商户类型:1、基于关键词匹配的商户类型识别方法。基于商户名称能够在一定程度上反映商户的主营业务的前提假设,该类方法通过关键词表进行正则匹配的方式对商户对应的商户类型是否准确进行判断。该方法的缺点在于对词表的完整性以及关键词的排他性要求很高,对本文档来自技高网...

【技术保护点】
1.一种识别商户类型的方法,其特征在于,包括:/n从持卡人的交易信息中获取商户的商户名称;/n通过所述商户名称与各商户类型的预设词表的匹配,确定所述商户对应的第一商户类型;所述各商户类型的预设词表包括每个商户类型对应的多个词分类下的各词语;其中,每个词语所属的词分类是根据该词语在该词分类下的词频确定的;/n若确定所述第一商户类型存在相似的第二商户类型,则将所述交易信息输入相似商户分类模型,所述相似商户分类模型是由所述第一商户类型所对应的历史交易信息与所述第二商户类型所对应的历史交易信息训练得到的;/n获取由所述相似商户分类模型输出的第三商户类型;确定所述第三商户类型为所述商户所属的商户类型。/...

【技术特征摘要】
1.一种识别商户类型的方法,其特征在于,包括:
从持卡人的交易信息中获取商户的商户名称;
通过所述商户名称与各商户类型的预设词表的匹配,确定所述商户对应的第一商户类型;所述各商户类型的预设词表包括每个商户类型对应的多个词分类下的各词语;其中,每个词语所属的词分类是根据该词语在该词分类下的词频确定的;
若确定所述第一商户类型存在相似的第二商户类型,则将所述交易信息输入相似商户分类模型,所述相似商户分类模型是由所述第一商户类型所对应的历史交易信息与所述第二商户类型所对应的历史交易信息训练得到的;
获取由所述相似商户分类模型输出的第三商户类型;确定所述第三商户类型为所述商户所属的商户类型。


2.如权利要求1所述的方法,其特征在于,所述多个词分类包括白词、黑词及模糊词;各商户类型对应的白词均不同;同一类型的商户类型对应的白词和黑词均不同;
通过所述商户名称与各商户类型的预设词表的匹配,确定所述商户对应的第一商户类型,包括:
将所述商户名称切分成至少一个分词;
在确定所述至少一个分词中包含白词、黑词及模糊词或所述至少一个分词中不包含任一白词且包含模糊词后,针对每个商户类型,根据每个分词属于所述商户类型的概率,确定所述商户名称属于所述商户类型的概率;其中,每个分词属于所述商户类型的概率是根据历史交易信息确定的;
确定概率最高的商户类型为所述商户对应的第一商户类型。


3.如权利要求2所述的方法,其特征在于,通过公式(1)确定所述商户名称属于所述商户类型的概率,包括:
公式(1)



其中,wi(i=1,2,3,……,n)为商户名称中包含的第i个分词;mcci表示第i个商户类型;p(wi)表示分词wi在所有商户名称中出现的概率;p(wi|mcci)表示分词wi在商户类型mcci下的商户名称中出现的概率;p(mcci|w1w2w3……wn)表示包含词汇w1、w2、w3……wn的商户名称属于商户类型mcci的概率。


4.如权利要求2所述的方法,其特征在于,还包括:
在确定所述至少一个分词中包含白词且不包含黑词时,将所述白词所对应的商户类型确定为所述商户对应的第一商户类型。


5.如权利要求2所述的方法,其特征在于,还包括:
在确定所述至少一个分词中包含白词、黑词且不包含任一模糊词;或,所述至少一个分词中不包含任一白词且不包含任一模糊词后,将所述商户申报的商户类型确定为所述商户对应的第一商户类型。


6.如权利要求2所述的方法,其特征在于,
确定概率最高的商户类型为所述商户对应的第一商户类型,包括:
确定概率最高的商户类型为所述商户对应的初始商户类型;
在确定所述至少一个分词中不包含所述初始商户类型下的任一黑词,则确定所述概率最高的商户类型为所述商户对应的第一商户类型。


7.如权利要求6所述的方法,其特征在于,所述确定概率最高的商户类型为所述商户对应的初始商户类型之后,还包括:
在确定所述至少一个分词中包含所述初始商户类型下的任一黑词,则将所述商户申报的商户类型确定为所述商户对应的第一商户类型。


8.如权利要求1-7任一项所述的方法,其特征在于,包括:
若确定所述第一商户类型不存在相似的第二商户类型,则确定所述第一商户类型为所述商户所属的商户类型。


9.如权利要求1-7任一项所述的方法,其特征在于,还包括:
根据所述持卡人的多个交易信息对应的多个商户类型,确定所述持卡人在各个消费类型下的交易情况;
针对任一消费类型,比较持卡人在所述消费类型下的交易情况与设定区域的全部持卡人在所述消费类型下的交易情况,得到所述消费类型下的比较结果;
根据各个消费类型下的比较结果,确定所述持卡人的消费偏好。


10.一种识别商户类型的装置,其特征在于,包括:
获取单元,用于从持卡人的交易信息中获取商户的商户名称;
确定单元,用于通过所述商户名称与各商户类型的预设词...

【专利技术属性】
技术研发人员:付翔鹏周航徐婷婷赵萌
申请(专利权)人:银联智策顾问上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1