【技术实现步骤摘要】
【国外来华专利技术】使用神经网络的验证模型相关申请的交叉引用本申请要求于2018年7月24日提交的美国专利申请序列号16/043,752的优先权的权益,其要求于2017年8月4日提交的美国临时专利申请序列号62/541,132的优先权的权益,这些专利申请都通过引用整体并入本文。
技术介绍
收入验证是在给定诸如人的姓名、位置、职称和雇主之类的基本身份信息的情况下证实该人的申报收入的问题。其被广泛用于抵押贷款、租赁申请和其他金融风险模型的上下文中。然而,当前围绕验证的过程涉及大量的人力和文档收集,这既耗时又昂贵。附图说明附图中的各个附图仅图示了本公开的示例实施例,并且不应被认为是对其范围的限制。图1是图示了根据一些示例实施例的联网系统的框图。图2是图示了根据一些示例实施例的一个示例收入验证系统的框图。图3是图示了根据一些示例实施例的另一示例收入验证系统的框图。图4是图示了根据一些示例实施例的又一示例收入验证系统的框图。图5是图示了根据一些示例实施例的用于生成收入预测的方法的各方面的流程图。图6是图示了根据一些示例实施例的可以被安装在机器上的软件架构的示例的框图。图7图示了根据示例实施例的以计算机系统的形式的机器的图解表示,在该机器中,指令集可以被执行以使机器执行本文所讨论的方法中的任何一个或多个方法。具体实施方式本文描述的示例系统和方法涉及利用深度神经网络的收入验证。如上面以示例方式所解释的那样,收入验证包括在诸如姓名、位置、职称和雇主之类的基本身份信 ...
【技术保护点】
1.一种方法,包括:/n由计算系统接收用户数据,所述用户数据包括用户姓名、用户雇主、用户职位和用户薪水;/n由所述计算系统基于所述用户数据生成搜索查询,以使用所述搜索查询执行互联网搜索;/n从来自使用所述搜索查询的所述互联网搜索的互联网搜索结果中提取数据;/n从所提取的所述数据中生成互联网搜索收入记录;/n基于所述用户数据从包括收入记录的一个或多个数据库中生成收入记录;/n将所述互联网搜索收入记录和从所述一个或多个数据库中生成的所述收入记录进行组合,以形成组合的收入记录结果;/n从所述组合的收入记录结果中标识候选收入记录;/n从每个候选收入记录中提取特征以用于生成收入预测;/n基于从所述候选收入记录中提取的所述特征,使用用以预测收入的机器学习模型来生成所述收入预测;以及/n向一个或多个计算设备提供所述收入预测。/n
【技术特征摘要】
【国外来华专利技术】20170804 US 62/541,132;20180724 US 16/043,7521.一种方法,包括:
由计算系统接收用户数据,所述用户数据包括用户姓名、用户雇主、用户职位和用户薪水;
由所述计算系统基于所述用户数据生成搜索查询,以使用所述搜索查询执行互联网搜索;
从来自使用所述搜索查询的所述互联网搜索的互联网搜索结果中提取数据;
从所提取的所述数据中生成互联网搜索收入记录;
基于所述用户数据从包括收入记录的一个或多个数据库中生成收入记录;
将所述互联网搜索收入记录和从所述一个或多个数据库中生成的所述收入记录进行组合,以形成组合的收入记录结果;
从所述组合的收入记录结果中标识候选收入记录;
从每个候选收入记录中提取特征以用于生成收入预测;
基于从所述候选收入记录中提取的所述特征,使用用以预测收入的机器学习模型来生成所述收入预测;以及
向一个或多个计算设备提供所述收入预测。
2.根据权利要求1所述的方法,其中在接收到所述用户数据之后,所述方法还包括:
标准化所述用户数据以符合用于所述用户姓名、所述用户雇主、所述用户职位和所述用户薪水的标准格式。
3.根据权利要求1所述的方法,其中标识所述候选收入记录包括:
将所述组合的收入记录结果中的每个收入记录与所述用户数据进行比较;
确定针对所述组合的收入记录结果中的每个收入记录的相似性分数;以及
基于针对所述组合的收入记录结果中的每个收入记录的所述相似性分数,从所述组合的收入记录结果中选择预定数目的候选收入记录以用于生成所述收入预测。
4.根据权利要求3所述的方法,还包括:
丢弃所述组合的收入记录结果中具有低于预定阈值的相似性分数的任何收入记录。
5.根据权利要求3所述的方法,其中所提取的所述特征包括针对每个候选收入记录的所述相似性分数和薪水范围。
6.根据权利要求5所述的方法,其中所述薪水范围包括最低薪水额、中值薪水额和最高薪水额。
7.根据权利要求1所述的方法,其中所述收入预测是第一收入预测,并且所述机器学习模型是第一机器学习模型,并且所述方法还包括:
从标准化的所述用户数据中生成职位向量、雇主向量和州向量;
使用所述职位向量、所述雇主向量和所述州向量,使用用以预测收入的第二机器学习模型来生成第二收入预测;以及
使用所述第一收入预测和所述第二收入预测,使用第三机器学习模型来生成组合的收入预测。
8.根据权利要求1所述的方法,其中从所提取的所述数据中生成所述互联网搜索收入记录还包括:标准化所述互联网搜索收入记录以符合所述标准格式。
9.根据权利要求1所述的方法,其中基于所述用户数据从包括收入记录的所述一个或多个数据库中生成所述收入记录包括:
基于所述用户数据生成第二搜索查询;以及
根据所述第二搜索查询的结果从所述一个或多个数据库中生成所述收入记录。
10.根据权利要求9所述的方法,其中根据所述第二搜索查询的所述结果从所述一个或多个数据库中生成所述收入记录还包括:标准化来自所述一个或多个数据库的所述收入记录以符合所述标准格式。
11.一种系统,包括:
存储器,所述存储器存储指令;以及
一个或多个处理器,所述一个或多个处理器由所述指令配置为执行操作,所述操作包括:
接收用户数据,所述用户数据包括用户姓名、用户雇主、用户职位和用户薪水;
基于所述用户数据生成搜索查询,以使用所述搜索查询执行互联网...
【专利技术属性】
技术研发人员:C·玛哈帕特拉,K·贝拉雷,
申请(专利权)人:空中食宿公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。