一种信息审核方法及系统技术方案

技术编号:28297124 阅读:12 留言:0更新日期:2021-04-30 16:22
本发明专利技术涉及一种信息审核方法及系统,属于信息处理领域。利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;利用训练后的BIP数据管理系统基于申请材料的非关系型数据构建用户的用户画像;利用用户画像对异常数据库中错误的关系型数据进行修复;利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;利用决策树算法,对特征数据是否符合预设的审核标准进行判断;符合审核标准的数据通过审核;不符合审核标准的数据未通过审核。本发明专利技术将人工智能技术应用到了交通业务信息处理和审核过程中,能够有效提升信息审核处理质量和效率。

【技术实现步骤摘要】
一种信息审核方法及系统
本专利技术涉及信息处理领域,特别是涉及一种信息审核方法及系统。
技术介绍
现有在对交通业务进行审批和处理时,存在以下问题:1)数据质量低下:审批过程由人工肉眼审核以及业务经验判断,该处理存在数据不一致风险以及材料作假的情况,难以察觉;2)高延迟:从申请到审批基本上需要3个工作日以上,审批处理效率较低;3)用户操作复杂:对于申请人而言,由于每次办理都需要上传大量材料,操作过于复杂,整个业务办理下来基本在20分钟以上,办理效率较低。基于上述,现有在审批和处理交通业务时,存在审批处理质量较低、效率较低等问题。
技术实现思路
为了解决上述问题,本专利技术中提出了一种信息审核方法及系统。基于人工智能技术对交通业务进行处理,能够有效提升交通业务的审批、处理质量和效率。为实现上述目的,本专利技术提供了如下方案:一种信息审核方法,包括以下步骤:利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;将正确的关系型数据导入交通行业大数据中心平台;将错误的关系型数据导入异常数据库;利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像;利用所述用户画像对所述异常数据库中错误的关系型数据进行修复,将修复后的关系型数据也导入到所述交通行业大数据中心平台;利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;利用决策树算法,对所述特征数据是否符合预设的审核标准进行判断;符合审核标准的数据通过审核;不符合审核标准的数据未通过审核。本专利技术还提供了一种信息审核系统,包括:数据判断平台,用于利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;将正确的关系型数据导入交通行业大数据中心平台;将错误的关系型数据导入异常数据库;用户画像构建平台,用于利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像;数据修复平台,用于利用所述用户画像对所述异常数据库中错误的关系型数据进行修复,将修复后的关系型数据也导入到所述交通行业大数据中心平台;特征提取平台,用于利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;审核决策平台,用于利用决策树算法,对所述特征数据是否符合预设的审核标准进行判断;符合审核标准的数据通过审核;不符合审核标准的数据未通过审核。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:1)本专利技术采用人工智能技术,完成业务从申请到审批每一步环节都达到当场出具结论,无需等待管理人员审核,从而大大提高了业务办理效率;通过人工智能技术,可以大大提高业务审批准确率;2)采用深度学习技术,通过栈式降噪自编码器构造深度降噪自编码网络,利用深度网络在数据特征提取方面的优势以及强大的泛化能力发掘数据之间潜在的关联关系,以及通过图文识别、文档智能分析来完成非结构化数据的提取,将提取的数据与分析数据进行特征对比来完成数据的修复;3)采用知识图谱用户画像技术,对用户操作数据以及其他维度数据进行画像分析,确保用户档案数据的准确性和真实性;4)采用的深度降噪自编码网络模型具有较强的可迁移性和普适性,通过采用特定应用场景下的样本数据对网络模型进行重新训练或者在已训练好的网络模型的基础上进行微调,就可对不同场景下的数据进行治理,降低了深度学习对于硬件设备的需求以及算法模型的开发成本,提升了模型的准确性和有效性,进而提升了业务审批的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例1中信息审核方法的流程图;图2为本专利技术实施例3中信息审核系统的结构示意图。符号说明:1-数据判断平台,2-用户画像构建平台,3-数据修复平台,4-特征提取平台,5-审核决策平台;图2中的正确数据表示正确的关系型数据,错误数据表示错误的关系型数据。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。高速公路作为重要的运输沟通桥梁,地位越来越重要,但是近年来,高速公路超限货物运输现象愈演愈烈,造成交通事故频发,同时也严重影响了高速公路的使用寿命。为加快高速公路安全管理,对超限货物运输进行有针对性的治理,是改变当权现状,提升安全与数据质量管理的重要措施,也是确保安全运行与经济发展顺利进行的重要保证。根据专家分析,车辆超限重量的增加和其对路面的损害是呈几何倍数增长,超限10%的货车对道路的损坏会增加40%,一辆超载2倍的车辆行驶一次,对公路的损害相当于不超限车辆行驶16次;一辆36吨的超载车辆对道路的损坏程度相当于9600车1.8吨重的小汽车对道路的破坏。其中,超载车辆大多采取加装钢板弹簧等方法,使货车总重量及轴载量大大超过了公路桥梁的设计载荷标准,从而导致了大部分桥梁涵洞出现拱圈开裂、桥墩变形等病状,引起桥梁结构灾难性的破坏。目前超载货车越超越大,越超越重,一辆5吨的货车居然改造成20吨,甚至30吨;15吨的货车则被改造成近100吨的货车使用。目前在国内的交通行业公路超限运输业务基本上还是采用传统的应用系统进行业务审批,审批过程采用人工方式进行材料核验以及业务条件分析,因此交通运输行业下限运输业务偶尔会发生由于业务员审批不仔细,出现基本条件不符合也给予审批通过的情况,这样无法为将来数据政府、行业智慧感知及应急预判、提前干预引导等提供科学有效而强力的数据支撑。而且,随着智能化设备的普及应用,交通数据量和数据种类不断迅速增加,如果单纯依靠人工核检或传统的人工规则方式已经无法满足对于基层数据质量和核查效率、核查能力的要求。基于上述,现有在交通业务审核中存在以下问题:1)数据质量低下:审核过程由人工肉眼审核以及业务经验判断,这种处理方式存在数据不一致风险以及材料作假的情况,难以察觉;2)高延迟:从申请到审批基本上需要3个工作日以上,审批效率较低;3)用户操作复杂:对于申请人而言,由于每次办理都需要上传大量材料,操作过于复杂,整个业务办理下来基本上在20分钟以上,业务办理效率较低。为了解决上述问题,本专利技术提出了一种信息审核方法和一种信息审核系统,使用人工智能技术模拟业务人员的业务审批经验,从而实现智慧型超载运输审批系统的业务自动秒批示范功能;通过机器学习技术来识别业务申请材料、建本文档来自技高网...

【技术保护点】
1.一种信息审核方法,其特征在于,包括以下步骤:/n利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;将正确的关系型数据导入交通行业大数据中心平台;将错误的关系型数据导入异常数据库;/n利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像;/n利用所述用户画像对所述异常数据库中错误的关系型数据进行修复,将修复后的关系型数据也导入到所述交通行业大数据中心平台;/n利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;/n利用决策树算法,对所述特征数据是否符合预设的审核标准进行判断;/n符合审核标准的数据通过审核;不符合审核标准的数据未通过审核。/n

【技术特征摘要】
1.一种信息审核方法,其特征在于,包括以下步骤:
利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性;将正确的关系型数据导入交通行业大数据中心平台;将错误的关系型数据导入异常数据库;
利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像;
利用所述用户画像对所述异常数据库中错误的关系型数据进行修复,将修复后的关系型数据也导入到所述交通行业大数据中心平台;
利用训练后的栈式降噪自编码器在正确的关系型数据和修复后的关系型数据中提取特征数据;
利用决策树算法,对所述特征数据是否符合预设的审核标准进行判断;
符合审核标准的数据通过审核;不符合审核标准的数据未通过审核。


2.根据权利要求1所述的信息审核方法,其特征在于,利用训练后的机器学习数据质量分析系统判断用户申请材料中关系型数据的正确性,具体包括:
构建训练数据集和测试数据集;
所述训练数据集中包括与所述申请文件中关系型数据类型对应的预设数量的训练数据;所述测试数据集中包括与所述申请文件中关系型数据类型对应的预设数量的测试数据;
将所述训练数据作为所述机器学习数据质量分析系统的输入,将所述训练数据对应的标签作为所述机器学习数据质量分析系统的输出,对所述机器学习数据质量分析系统进行训练,得到初始训练后的机器学习数据质量分析系统;
将所述测试数据作为初始训练后的机器学习数据质量分析系统的输入,利用初始训练后的机器学习数据质量分析系统进行处理,得到输出数据;
判断所述输出数据与所述测试数据对应的标签的误差值是否在预设范围内;
若在预设范围内,则认为所述输出数据是正确数据;若不在预设范围内,则认为所述输出数据是错误数据;此时对初始训练后的机器学习数据质量分析系统的参数进行调整,直到所述数据是正确数据为止;
待所有的测试数据对应的输出结果均为正确数据时,将初始训练后的机器学习数据质量分析系统作为训练后的机器学习数据质量分析系统。


3.根据权利要求2所述的信息审核方法,其特征在于,利用训练后的机器学习数据质量分析系统判断申请材料中关系型数据的正确性,具体包括:
将所述申请材料中的关系型数据作为训练后的机器学习数据质量法分析系统的输入,训练后的机器学习数据质量分析系统直接得到输出数据;
若所述输出数据是正确数据,则将所述申请材料中正确的关系型数据导入交通行业大数据中心平台;若所述输出数据是错误数据,则将所述申请材料中错误的关系型数据导入异常数据库。


4.根据权利要求1所述的信息审核方法,其特征在于,利用训练后的BIP数据管理系统基于所述申请材料的非关系型数据构建所述用户的用户画像,具体包括:
利用数据协同交换中心实现不同平台、不同接口中非关系型数据的导入;
构建并训练图文识别模型;
利用训练后的图文识别模型从所述非关系型数据中提取内容数据;
基于提取的内容数据,利用知识图谱用户画像技术构建所述用户的用户画像。


5.根据权利要求4所述的信息审核方法,其特征在于,利用数据协同交换中心实现不同平台、不同接口中非关系型数据的导入,具体包括:
基于Oracle透明网关技术、IBM的一致化数据表技术、MOM数据交换技术或WebService交换机制实现不同平台、不同接口中非关系型数据的导入。


6.根据权利要求4所述的信息审核方法,其特征在于,构建并训练图文识别模型,具体包括:
构建第一训练图像集和第一测试图像集;
所述第一训练图像集中的第一训练图像和所述第一测试图像集中的第一测试图像的每个图像中标注有需要识别的内容区域;
将所述第一训练图像作为第一卷积神经网络的输入,将所述第一训练图像对应的标签作为所述第一卷积神经网络的输出,对所述第一卷积神经网络进行训练,得到训练后的第一卷积神经网络;
将所述第一测试图像作为训练后的第一卷积神经网络的输入,利用训练后的第一卷积神经网络得到输出结果;将所述输出结果与所述第一测试图像对应的标签进行比较,判断两者的误差值是否在第一预设范围内;
若在第一预设范围内,则认为识别到了内容区域,并将所述第一卷积神经网络作为所述图文识别模型中用于图文识别的第一处理神经网络;
若不在第一预设范围内,则认为没有识别到内容区域,并对所述第一卷积神经网络的参数进行调整,重新利用调整参数后的第一卷积神经网络对所述第一测试图像进行处理...

【专利技术属性】
技术研发人员:周新焕彭卫康田涛
申请(专利权)人:深圳市金桥软件有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1