一种将金融机构流水与运营商数据匹配的方法技术

技术编号:15503734 阅读:120 留言:0更新日期:2017-06-04 00:02
本发明专利技术公开了一种将金融机构流水与运营商数据匹配的方法,包括:获取在金融机构端生成的交易流水数据,所述交易流水数据包括:银行交易流水、银联流水或者第三方支付平台流水;获取在电信运营商端生成的提醒信息,所述提醒信息包括:短信内容、原始DNS日志或者原始URL日志;从以上交易流水和运营商的提醒信息中提取用户编码和发生时间,并按照发生时间进行排序,分别得到交易流水的集合和提醒信息的集合;从以上集合中获取指定的参数,利用发生时间进行匹配,将匹配的用户编号视作同一用户或同一属性用户,利用匹配的用户编号下的全部数据,分析其消费行为和支付行为,同时输出成功匹配的结果。

Method for matching data of flow of financial institution with carrier data

The invention discloses a method for matching, financial institutions and operators of water data includes: acquiring transaction data generated in the end of the financial institutions, the transaction flow data including: water, water cup or the third party payment platform water bank transaction; get generated in the telecom operators end remind information, the alert information includes: message content, original or original URL DNS log log; extract user encoding from the above transaction flow and operators to remind information and time, and sorted according to the time of occurrence, respectively, to set the transaction flow and collection of information to remind; obtain the specified parameters from above in the collection, use of time match, the user number, as the same users or the same user attributes, using all the data, the number of users Analysis of consumer behavior and payment behavior, while the output of successful matching results.

【技术实现步骤摘要】
一种将金融机构流水与运营商数据匹配的方法
本专利技术属于一种将金融机构流水与运营商数据匹配的方法和系统。
技术介绍
随着银行发卡(借记卡、贷记卡)数量的快速增加,以及各类支付技术的迅猛发展,人们日常生活中的消费场景也在不断变化。人们在消费时,使用银行卡支付或者第三方支付的比重越来越大,使用现金作为支付手段的比重越来越小。每个用户使用银行卡或者第三方支付平台消费时,都会在金融机构端和电信运营商端产生记录,记录本身彼此孤立。在信息化趋势下,如何对接金融机构流水和运营商数据,打破数据孤岛,更好的挖掘和利用大数据价值,成为重要的一环。金融机构和电信运营商分别留存大量的用户消费/支付行为相关的数据。例如银行用户的账户流水、运营商用户的短信记录等。目前的大数据分析更多是在对这样的数据集本身进行挖掘,总结规律,但并没有实现这两类用户数据(金融机构流水、运营商数据)的关联。银行卡消费/电子支付行为属于高频行为,并且人们在日常生活中经常切换各类支付方式。相关的消费/支付数据分散,各自成为孤岛,分析其中任何一部分,都难以代表整体全貌(例如金融机构的数据受一人多卡的限制,电信运营商的数据受不同网络类型切换的限制)。缺少唯一标识,难以识别用户,使得相关的描绘用户消费行为的分析无法达到精准。
技术实现思路
本专利技术所要解决的技术问题是提供一种将金融机构流水与运营商数据匹配的方法,用于解决现有技术存在的技术问题。本专利技术解决上述技术问题所采取的技术方案如下:一种将金融机构流水与运营商数据匹配的方法,包括:获取在金融机构端生成的交易流水数据,所述交易流水数据包括:银行交易流水、银联流水或者第三方支付平台流水;获取在电信运营商端生成的提醒信息,所述提醒信息包括:短信内容、原始DNS日志或者原始URL日志;从以上交易流水和运营商的提醒信息中提取用户编码和发生时间,并按照发生时间进行排序,分别得到交易流水的集合和提醒信息的集合;从以上集合中获取指定的参数,利用发生时间进行匹配,将匹配的用户编号视作同一用户或同一属性用户,利用匹配的用户编号下的全部数据,分析其消费行为和支付行为,同时输出成功匹配的结果。优选的是,所述指定的参数包括:用户编码、开始时间、结束时间、时间差容忍度和匹配概率阈值。优选的是,从以上交易流水和运营商的提醒信息中提取用户编码和发生时间,具体包括:若数据源是短信,则不判断短信内容,把全部短信发送时间提取出来;若数据源是DNS/URL日志,则采纳符合规则的子集,该规则是若干个指定的域名,并且时间项提取的对应字段为开始时间。优选的是,从以上集合中获取指定的参数,利用发生时间进行匹配,将匹配的用户编号视作同一用户或同一属性用户,包括:若提供的用户编码是交易流水中的用户编码,则输出结果为与之匹配的提醒信息中的用户编码,其为空或者有多个;若提供的用户编码是提醒信息中的用户编码,则输出结果为与之匹配的交易流水中的用户编码,其为空或者有多个。优选的是,若数据源是DNS/URL日志,从以上交易流水和运营商的提醒信息中提取用户编码和发生时间具体包括:设定并获取N款产生提醒信息的金融机构平台或APP,记为Bi,其域名集合为Hi,且每个Hi对应且只对应1个Bi,并且每个Bi至少对应1个Hi;将每一条DNS/URL日志中的Host字段,与Hi的集合进行比对,若Host字段与某个Hi相同,则将该条DNS/URL日志筛选出来。优选的是,从以上集合中获取指定的参数,利用发生时间进行匹配,包括:交易流水集合中的用户编码和发生时间分别标记为LIDi和LTi,集合内每条记录标记为(LIDi,LTi);提醒信息集合中的用户编码和发生时间分别标记为XIDi和XTi,集合内每条记录标记为(XIDi,XTi),获取用户编码为ID,起始时间为ST,结束时间为ET,时间差容忍度为a(a>=0),匹配概率阈值为p*(0%<p*<=100%);对于交易流水集合,由前至后找到第一条满足LTi>ST的记录LTS,由后至前找到第一条满足LTi<ET的记录LTE,选取出的集合区间为:(LIDi,LTi),ST<LTi<ET;对于提醒信息集合,由前至后找到第一条满足XTi>ST的记录XTS,由后至前找到第一条满足XTi<ET的记录XTE,选取出的集合区间为:(XIDi,XTi),ST<XTi<ET;在已选取的交易流水集合:(LIDi,LTi),ST<LTi<ET内,针对每一个LIDi进行LIDi=ID的判断,若判断为真,才提取出来,这样选取出的交易流水集合为:(LIDi,LTi),LIDi=ID,ST<LTi<ET。在已选取的交易流水集合:(LIDi,LTi),LIDi=ID,ST<LTi<ET内,针对每一个LTi,在提醒信息集合区间内查找是否有符合:LTi-a<=XTi<=LTi+a的记录(XIDi,XTi)。若有符合的记录,将其提取出来;若同时有多条符合的记录,多条记录全部提取出来;在每个LTi都参与判断之后,该匹配过程结束,获得已匹配的列表(XIDi,XTi),其中每个XTi都能找到至少1个LTi使得-a<=XTi-LTi<=+a。在已匹配的列表(XIDi,XTi)中,先做一步去除噪音:将只出现过n次或者小于n次的XIDi所对应的(XIDi,XTi)记录删除,其中,n是噪音阀值,即匹配记录小于等于n次时不足以取信;在剩余的记录集合中,针对XIDi判断是否存在ID*使得:∑(XIDi,XIDi=ID*)÷∑XIDi>=P*,将符合条件的ID*提取出来;其中,满足条件的ID*可能有多个,则都提取出来,作为结果项:ID1*、ID2*、……、IDj*(0<=j<=1/p*),ID*即为匹配成功的运营商用户编码,直接将其输出;将两端全部匹配的用户编号视作同一用户或同一属性用户,利用匹配的用户编号下的全部数据,分析其消费行为和支付行为。优选的是,进一步包括:如已知银行流水中的用户编码ID,匹配得到运营商用户编码ID*:ID1*、ID2*、……、IDj*(0<=j<=1/p*),然后将每个ID*作为输入依次进行同样的匹配过程,即参数ST、ET、a、p*保持不变,输出与之匹配的金融机构用户编码集合,标记为ID**。若ID**为空集,或者只包含ID,则双向匹配结束;若ID**包含新的用户编码,则再将其进行匹配算法并输出匹配的运营商用户编码结果,直到某次匹配结束后,输出的匹配编码集合为空集,或者其中全部元素均为重复项,这时双向匹配过程结束。优选的是,进一步包括:根据时间缩小区间的时候,将目标时间段设置为多组互不重叠的(ST,ET)组合,用每组(ST,ET)获得一个集合区间,全部(ST,ET)组合获得的区间的并集,为第一步最终得到的集合区间。优选的是,若原始日志的时间精确到秒,时间差容忍度a=0:若原始日志的时间精确到毫秒,允许有一定区间,如a=300毫秒或500毫秒;或者,若目标匹配的数据源偏单一,则匹配概率阈值p*设定大于70%。若目标匹配的数据源覆盖很广,则p*设定小于50%。本专利技术采取了上述方案以后,仅仅基于大数据存储和计算,仅利用“时间,,这一个变量,匹配金融机构和电信运营商两端的消费记录,识别用户,描绘用户消费行为。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中本文档来自技高网...
一种将金融机构流水与运营商数据匹配的方法

【技术保护点】
一种将金融机构流水与运营商数据匹配的方法,包括:获取在金融机构端生成的交易流水数据,所述交易流水数据包括:银行交易流水、银联流水或者第三方支付平台流水;获取在电信运营商端生成的提醒信息,所述提醒信息包括:短信内容、原始DNS日志或者原始URL日志;从以上交易流水和运营商的提醒信息中提取用户编码和发生时间,并按照发生时间进行排序,分别得到交易流水的集合和提醒信息的集合;从以上集合中获取指定的参数,利用发生时间进行匹配,将匹配的用户编号视作同一用户或同一属性用户,利用匹配的用户编号下的全部数据,分析其消费行为和支付行为,同时输出成功匹配的结果。

【技术特征摘要】
1.一种将金融机构流水与运营商数据匹配的方法,包括:获取在金融机构端生成的交易流水数据,所述交易流水数据包括:银行交易流水、银联流水或者第三方支付平台流水;获取在电信运营商端生成的提醒信息,所述提醒信息包括:短信内容、原始DNS日志或者原始URL日志;从以上交易流水和运营商的提醒信息中提取用户编码和发生时间,并按照发生时间进行排序,分别得到交易流水的集合和提醒信息的集合;从以上集合中获取指定的参数,利用发生时间进行匹配,将匹配的用户编号视作同一用户或同一属性用户,利用匹配的用户编号下的全部数据,分析其消费行为和支付行为,同时输出成功匹配的结果。2.根据权利要求1所述的将金融机构流水与运营商数据匹配的方法,其特征在于,所述指定的参数包括:用户编码、开始时间、结束时间、时间差容忍度和匹配概率阈值。3.根据权利要求1或2所述的将金融机构流水与运营商数据匹配的方法,其特征在于,从以上交易流水和运营商的提醒信息中提取用户编码和发生时间,具体包括:若数据源是短信,则不判断短信内容,把全部短信发送时间提取出来;若数据源是DNS/URL日志,则采纳符合规则的子集,该规则是若干个指定的域名,并且时间项提取的对应字段为原始日志中的开始时间。4.根据权利要求1或2所述的将金融机构流水与运营商数据匹配的方法,其特征在于,从以上集合中获取指定的参数,利用发生时间进行匹配,将匹配的用户编号视作同一用户或同一属性用户,包括:若提供的用户编码是交易流水中的用户编码,则输出结果为与之匹配的提醒信息中的用户编码,其为空或者有多个;若提供的用户编码是提醒信息中的用户编码,则输出结果为与之匹配的交易流水中的用户编码,其为空或者有多个。5.根据权利要求1所述的将金融机构流水与运营商数据匹配的方法,其特征在于,若数据源是DNS/URL日志,从以上交易流水和运营商的提醒信息中提取用户编码和发生时间具体包括:设定并获取N款产生提醒信息的金融机构平台或APP,记为Bi,其域名集合为Hi,且每个Hi对应且只对应1个Bi,并且每个Bi至少对应1个Hi;将每一条DNS/URL日志中的Host字段,与Hi的集合进行比对,若Host字段与某个Hi相同,则将该条DNS/URL日志筛选出来。6.根据权利要求1所述的将金融机构流水与运营商数据匹配的方法,其特征在于,从以上集合中获取指定的参数,利用发生时间进行匹配,包括:交易流水集合中的用户编码和发生时间分别标记为LIDi和LTi,集合内每条记录标记为(LIDi,LTi);提醒信息集合中的用户编码和发生时间分别标记为XIDi和XTi,集合内每条记录标记为(XIDi,XTi),获取用户编码为ID,起始时间为ST,结束时间为ET,时间差容忍度为a(a>=0),匹配概率阈值为p*(0%<p*<=100%);对于交易流水集合,由前至后找到第一条满足LTi>ST的记录LTS,由后至前找到第一条满足LTi<ET的记录LTE,选取出的集合区间为:(LIDi,LTi),ST<LTi<ET;对于提醒信息集合,由前至后找到第一条满足XTi...

【专利技术属性】
技术研发人员:尹嘉路白晟丁文涛
申请(专利权)人:久远谦长北京技术服务有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1