一种数据匹配方法及装置制造方法及图纸

技术编号:8215672 阅读:227 留言:0更新日期:2013-01-17 13:21
本发明专利技术公开了一种数据匹配方法,包括:获取客户信息数据中要进行匹配的待处理数据;将所述待处理数据进行格式转换,生成预处理数据;根据预存的字符串最大值和字符标准值,利用逆向最大匹配法对所述预处理数据进行数据分割,生成等级由高到低排列的多个子数据;根据预存的子数据标准名称和字符转换规则,将所述多个子数据转换为一条标准数据;将所述标准数据与所述待处理数据进行比较,计算生成匹配值。本发明专利技术实施例的数据匹配方法及装置,提高了比对的效率和准确性,降低人工操作成本,实现大数据量的处理;实现了对客户信息数据中的中文数据项进行比对的系统化、自动化、流程化、客观化。

【技术实现步骤摘要】

本专利技术涉及数据处理
,尤其涉及一种数据匹配方法及装置
技术介绍
目前,在处理各类客户信息数据时,经常需要进行数据比较、匹配等处理首先,系统通过多种渠道获取较准确权威的个人外部数据,例如公安系统数据、固定电话、黄页数据、高教部学历认证中心数据(教育学历、教育学籍等)以及机动车驾驶证数据、机动车行驶证数据等。另一方面,由客户填写输入的数据,在核对其正确性时需要和系统获取的上述数据进行比对。但客户填写输入的数据往往不规范,特别是如地址、公司名称等字数较多的信息。目前,一般采用全字符精确匹配技术或者人工比对方式。这些处理技术主要存在以下几方面不足I、全字符精确匹配可以对诸如姓名、婚姻状况、学历等简单数据项进行处理,但对较为复杂的数据,比如中文地址和中文公司名称等数据项,由于其来源于各种不同的数据环境,一般是由同一人多次输入或者是不同的人输入,其填写的数据具有一定的随意性和随机性,而全字符精确匹配没有任何容错能力,准确性不高,因此无法对此类数据项进行较好的比对和识别,例如“云岩区中天花园玉兰园D-1-10-2号”与“贵阳云岩中天花园玉兰园D座I单元10楼2号”使用全字符精确匹配无本文档来自技高网...

【技术保护点】
一种数据匹配方法,其特征在于,所述方法包括:获取客户信息数据中要进行匹配的待处理数据;将所述待处理数据进行格式转换,生成预处理数据;根据预存的字符串最大值和字符标准值,利用逆向最大匹配法对所述预处理数据进行数据分割,生成等级由高到低排列的多个子数据;根据预存的子数据标准名称和字符转换规则,将所述多个子数据转换为一条标准数据;将所述标准数据与所述待处理数据进行比较,计算生成匹配值。

【技术特征摘要】

【专利技术属性】
技术研发人员:曹折波胡弘毅黄文卿徐敏陈姗婷侯鹏燕
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1