【技术实现步骤摘要】
一种信息审核方法及系统
本专利技术涉及信息处理领域,特别是涉及一种信息审核方法及系统。
技术介绍
现有在对交通业务进行审批和处理时,存在以下问题:1)数据质量低下:审批过程由人工肉眼审核以及业务经验判断,该处理存在数据不一致风险以及材料作假的情况,难以察觉;2)高延迟:从申请到审批基本上需要3个工作日以上,审批处理效率较低;3)用户操作复杂:对于申请人而言,由于每次办理都需要上传大量材料,操作过于复杂,整个业务办理下来基本在20分钟以上,办理效率较低。基于上述,现有在审批和处理交通业务时,存在审批处理质量较低、效率较低等问题。
技术实现思路
为了解决上述问题,本专利技术中提出了一种信息审核方法及系统。基于人工智能技术对交通业务进行处理,能够有效提升交通业务的审批、处理质量和效率。为实现上述目的,本专利技术提供了如下方案:一种信息审核方法,包括以下步骤:利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;将正确的关系型数据导入交通行业大数据中心平台;将错误的关系型数据导入异常数据库;利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像;利用所述用户画像对所述异常数据库中错误的关系型数据进行修复,将修复后的关系型数据也导入到所述交通行业大数据中心平台;利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;利用决策树算法,对所述特征数据是 ...
【技术保护点】
1.一种信息审核方法,其特征在于,包括以下步骤:/n利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;将正确的关系型数据导入交通行业大数据中心平台;将错误的关系型数据导入异常数据库;/n利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像;/n利用所述用户画像对所述异常数据库中错误的关系型数据进行修复,将修复后的关系型数据也导入到所述交通行业大数据中心平台;/n利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;/n利用决策树算法,对所述特征数据是否符合预设的审核标准进行判断;/n符合审核标准的数据通过审核;不符合审核标准的数据未通过审核。/n
【技术特征摘要】
1.一种信息审核方法,其特征在于,包括以下步骤:
利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;将正确的关系型数据导入交通行业大数据中心平台;将错误的关系型数据导入异常数据库;
利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像;
利用所述用户画像对所述异常数据库中错误的关系型数据进行修复,将修复后的关系型数据也导入到所述交通行业大数据中心平台;
利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;
利用决策树算法,对所述特征数据是否符合预设的审核标准进行判断;
符合审核标准的数据通过审核;不符合审核标准的数据未通过审核。
2.根据权利要求1所述的信息审核方法,其特征在于,利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性,具体包括:
构建训练数据集和测试数据集;
所述训练数据集中包括与所述申请文件中关系型数据类型对应的预设数量的训练数据;所述测试数据集中包括与所述申请文件中关系型数据类型对应的预设数量的测试数据;
将所述训练数据作为所述机器学习数据质量分析系统的输入,将所述训练数据对应的标签作为所述机器学习数据质量分析系统的输出,对所述机器学习数据质量分析系统进行训练,得到初始训练后的机器学习数据质量分析系统;
将所述测试数据作为初始训练后的机器学习数据质量分析系统的输入,利用初始训练后的机器学习数据质量分析系统进行处理,得到输出数据;
判断所述输出数据与所述测试数据对应的标签的误差值是否在预设范围内;
若在预设范围内,则认为所述输出数据是正确数据;若不在预设范围内,则认为所述输出数据是错误数据;此时对初始训练后的机器学习数据质量分析系统的参数进行调整,直到所述数据是正确数据为止;
待所有的测试数据对应的输出结果均为正确数据时,将初始训练后的机器学习数据质量分析系统作为训练后的机器学习数据质量分析系统。
3.根据权利要求2所述的信息审核方法,其特征在于,利用训练后的机器学习数据质量分析系统判断申请材料中关系型数据的正确性,具体包括:
将所述申请材料中的关系型数据作为训练后的机器学习数据质量法分析系统的输入,训练后的机器学习数据质量分析系统直接得到输出数据;
若所述输出数据是正确数据,则将所述申请材料中正确的关系型数据导入交通行业大数据中心平台;若所述输出数据是错误数据,则将所述申请材料中错误的关系型数据导入异常数据库。
4.根据权利要求1所述的信息审核方法,其特征在于,利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像,具体包括:
利用数据协同交换中心实现不同平台、不同接口中非关系型数据的导入;
构建并训练图文识别模型;
利用训练后的图文识别模型从所述非关系型数据中提取内容数据;
基于提取的内容数据,利用知识图谱用户画像技术构建所述用户的用户画像。
5.根据权利要求4所述的信息审核方法,其特征在于,利用数据协同交换中心实现不同平台、不同接口中非关系型数据的导入,具体包括:
基于Oracle透明网关技术、IBM的一致化数据表技术、MOM数据交换技术或WebService交换机制实现不同平台、不同接口中非关系型数据的导入。
6.根据权利要求4所述的信息审核方法,其特征在于,构建并训练图文识别模型,具体包括:
构建第一训练图像集和第一测试图像集;
所述第一训练图像集中的第一训练图像和所述第一测试图像集中的第一测试图像的每个图像中标注有需要识别的内容区域;
将所述第一训练图像作为第一卷积神经网络的输入,将所述第一训练图像对应的标签作为所述第一卷积神经网络的输出,对所述第一卷积神经网络进行训练,得到训练后的第一卷积神经网络;
将所述第一测试图像作为训练后的第一卷积神经网络的输入,利用训练后的第一卷积神经网络得到输出结果;将所述输出结果与所述第一测试图像对应的标签进行比较,判断两者的误差值是否在第一预设范围内;
若在第一预设范围内,则认为识别到了内容区域,并将所述第一卷积神经网络作为所述图文识别模型中用于图文识别的第一处理神经网络;
若不在第一预设范围内,则认为没有识别到内容区域,并对所述第一卷积神经网络的参数进行调整,重新利用调整参数后的第一卷积神经网络对所述第一测试图像进行处理...
【专利技术属性】
技术研发人员:周新焕,彭卫康,田涛,
申请(专利权)人:深圳市金桥软件有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。