【技术实现步骤摘要】
【国外来华专利技术】大规模异构数据摄取和用户解析
本公开涉及用于高效组织与用户关联的大规模异构数据元素的数据关联、属性、注释和解释系统及相关方法。该系统和方法可以被实现以提供对用户历史数据元素的实时访问,这在之前未实现。
技术介绍
信用事件可以被收集、编译和分析以便以信用报告的形式提供个人信用度,信用报告典型地包括多个信用属性,诸如信用分数、信用账户信息以及与用户的财务价值有关的其他信息。例如,信用分数是重要的,因为它可以在交易实体之间建立必要的信任级别。例如,金融机构,诸如贷方、信用卡提供商、银行、汽车经销商、经纪人等,可以基于信用分数更安全地进行商业交易。
技术实现思路
公开了与用于高效组织大规模异构数据的数据关联、属性、注释和解释系统及相关方法有关的系统和方法。一个一般方面包括一种用于为收集的事件信息确定帐户持有者标识的计算机系统,该计算机系统包括:一个或多个硬件计算机处理器;以及一个或多个存储设备,其配置为存储软件指令,软件指令配置为被一个或多个硬件计算机处理器执行以使计算机系统:从多个数据源接收与相应多个事件关联的多个事件信息;对于每个事件信息:访问包括数据源与标识符参数之间关联的数据存储,标识符参数至少包括对来自相应数据源的事件信息中包括的一个或多个标识符的指示;至少基于事件信息的数据源的标识符参数,确定如被访问的数据存储中指示的事件信息中包括的标识符;至少基于相应标识符参数从事件信息中提取标识符,其中,标识符的组合包括与唯一用户关联的唯一标识,访问多个散列函数,每个散列函数与标识符的组合关联;对于每个唯一标识,通过对多个散列函数求值计算多个散列值;基于唯一标识是否共 ...
【技术保护点】
1.一种用于为收集的事件信息确定帐户持有者标识的计算机系统,所述计算机系统包括:一个或多个硬件计算机处理器;以及一个或多个存储设备,其配置为存储软件指令,所述软件指令配置为被所述一个或多个硬件计算机处理器执行以使所述计算机系统:从多个数据源接收与相应多个事件关联的多个事件信息;对于每个事件信息:访问包括数据源与标识符参数之间关联的数据存储,所述标识符参数至少包括对来自相应数据源的事件信息中包括的一个或多个标识符的指示;至少基于所述事件信息的数据源的标识符参数,确定如被访问的数据存储中指示的所述事件信息中包括的标识符;以及至少基于相应标识符参数从所述事件信息中提取标识符,其中,所述标识符的组合包括与唯一用户关联的唯一标识,访问多个散列函数,每个所述散列函数与标识符的组合关联;对于每个唯一标识,通过对所述多个散列函数求值计算多个散列值;基于唯一标识是否共享使用公共散列函数计算出的公共散列值,选择性地将唯一标识分组成与公共散列值关联的唯一标识集合;对于每个唯一标识集合:应用一个或多个匹配规则,所述一个或多个匹配规则包括用于在所述集合内比较唯一标识的标准;以及将满足所述一个或多个匹配规则的唯一 ...
【技术特征摘要】
【国外来华专利技术】2017.01.31 US 62/452,7011.一种用于为收集的事件信息确定帐户持有者标识的计算机系统,所述计算机系统包括:一个或多个硬件计算机处理器;以及一个或多个存储设备,其配置为存储软件指令,所述软件指令配置为被所述一个或多个硬件计算机处理器执行以使所述计算机系统:从多个数据源接收与相应多个事件关联的多个事件信息;对于每个事件信息:访问包括数据源与标识符参数之间关联的数据存储,所述标识符参数至少包括对来自相应数据源的事件信息中包括的一个或多个标识符的指示;至少基于所述事件信息的数据源的标识符参数,确定如被访问的数据存储中指示的所述事件信息中包括的标识符;以及至少基于相应标识符参数从所述事件信息中提取标识符,其中,所述标识符的组合包括与唯一用户关联的唯一标识,访问多个散列函数,每个所述散列函数与标识符的组合关联;对于每个唯一标识,通过对所述多个散列函数求值计算多个散列值;基于唯一标识是否共享使用公共散列函数计算出的公共散列值,选择性地将唯一标识分组成与公共散列值关联的唯一标识集合;对于每个唯一标识集合:应用一个或多个匹配规则,所述一个或多个匹配规则包括用于在所述集合内比较唯一标识的标准;以及将满足所述一个或多个匹配规则的唯一标识确定为唯一标识匹配集合;对各自包括至少一个公共唯一标识的唯一标识匹配集合进行合并,以提供与其他合并集合不具有公共唯一标识的一个或多个合并集合;对于每个合并集合:确定反向个人标识符;以及将所述反向个人标识符与所述合并集合中的唯一标识中的每一个关联;对于每个唯一标识:识别与关联于所述唯一标识的所述标识符的组合中的至少一个关联的事件信息;以及将所述反向个人标识符与所述识别的事件信息关联。2.如权利要求1所述的计算机系统,其中,所述散列函数至少包括:第一散列函数,其对从事件信息中提取的至少第一标识符的部分和至少第二标识符的部分的第一组合求值;以及第二散列函数,其对从事件信息中提取的至少所述第一标识符的部分和至少第三标识符的部分的第二组合求值。3.如权利要求2所述的计算机系统,其中,基于所述第一标识符或所述第二标识符中的一个或多个的标识符类型,选择所述第一散列函数。4.如权利要求2所述的计算机系统,其中,所述第一标识符是所述用户的社会保险号码,所述第二标识符是所述用户的姓氏,并且所述第一组合是少于所述社会保险号码所有数字与少于所述用户姓氏所有字符的串接。5.如权利要求2所述的计算机系统,其中,第一事件集合包括与所述第一散列值关联的多个事件,第二事件集合包括各自与所述第二散列值关联的多个事件。6.如权利要求1所述的计算机系统,其中,所述标识符选自:名字、姓氏、中间名首字母、中间名、出生日期、社会保险号码、纳税人ID或国家ID。7.如权利要求1所述的计算机系统,其中,所述计算机系统生成将反向个人标识符关联到所述合并集合中的剩余唯一标识中的每一个的反向映射,并将所述映射存储在数据存储中。8.如权利要求1所述的计算机系统,还包括...
【专利技术属性】
技术研发人员:阿努库尔·雷杰,普拉什安特·库马尔·萨海,默文·拉利,什里西·库马尔,圣斯卡尔·萨海,
申请(专利权)人:益百利信息解决方案公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。