【技术实现步骤摘要】
网页识别的处理方法、装置、系统及电子设备
本申请涉及一种网页识别的处理方法、装置、系统及电子设备,属于计算机
技术介绍
现有技术中,对于网页页面是否出现错误的测试以及日常监控,会采用机器学习模型来辅助处理。例如,采用以CNN(卷积神经网络)为代表的深度学习算法,此类算法基于特征值的比较为基础。这类算法比较智能,能够总结出特征值进行对比,但是存在的问题是需要的训练数据较大,在训练数据不足时容易误判,因此,其准确度还有待提升。
技术实现思路
本专利技术实施例提供一种网页识别的处理方法、装置、系统及电子设备,以提高网页识别模型的准确率。为了实现上述目的,本专利技术实施例提供了一种网页识别的处理方法,包括:获取网页识别模型对网页图片进行识别的识别结果,如果该识别结果为网页错误,则将该网页图片发送给报警处理平台,并触发网页错误报警;获取报警处理平台针对该网页错误报警的处理结果,如果处理结果为将该网页错误报警作为误报处理,则将该网页图片作为错误案例进行保存;使用该错误案例对所述网页识别模型进行训练,以更新所述网页识别模型。本专利技术实施例还提供了一种网页识别的处理装置,包括:网页识别控制模块,用于获取网页识别模型对网页图片进行识别的识别结果,如果该识别结果为网页错误,则将该网页图片发送给报警处理平台,并触发网页错误报警;错误案例生成模块,用于获取报警处理平台针对该网页错误报警的处理结果,如果处理结果为将该网页错误报警作为误报处理,则将该 ...
【技术保护点】
1.一种网页识别的处理方法,包括:/n获取网页识别模型对网页图片进行识别的识别结果,如果该识别结果为网页错误,则将该网页图片发送给报警处理平台,并触发网页错误报警;/n获取报警处理平台针对该网页错误报警的处理结果,如果处理结果为将该网页错误报警作为误报处理,则将该网页图片作为错误案例进行保存;/n使用该错误案例对所述网页识别模型进行训练,以更新所述网页识别模型。/n
【技术特征摘要】
1.一种网页识别的处理方法,包括:
获取网页识别模型对网页图片进行识别的识别结果,如果该识别结果为网页错误,则将该网页图片发送给报警处理平台,并触发网页错误报警;
获取报警处理平台针对该网页错误报警的处理结果,如果处理结果为将该网页错误报警作为误报处理,则将该网页图片作为错误案例进行保存;
使用该错误案例对所述网页识别模型进行训练,以更新所述网页识别模型。
2.根据权利要求1所述的方法,其中,所述获取报警处理平台针对该网页错误报警的处理结果,包括:
监控所述报警处理平台针对所述网页错误报警的处理行为,如果监控到选择忽略该网页错误报警的处理行为或者监控到将该网页图片标记为正常网页的处理行为,则确定为误报处理。
3.根据权利要求1所述的方法,其中,所述获取网页识别模型对网页图片进行识别的识别结果,包括:
运行网页测试脚本,抓取网页图片;
调用网页识别模型,对抓取的网页图片进行识别,生成识别结果。
4.根据权利要求1所述的方法,其中,所述获取网页识别模型对网页图片进行识别的识别结果,包括:
获取舆情监控系统上报的网页图片;
调用网页识别模型,对抓取的网页图片进行识别,生成识别结果。
5.根据权利要求1所述的方法,其中,使用该错误案例对所述网页识别模型进行训练,以更新所述网页识别模型包括:
以预设的时间间隔检测是否收到新的错误案例,如果检测到一个或多个新的错误案例,则使用该一个或多个新的错误案例对所述网页识别模型进行训练,以更新所述网页识别模型。
6.根据权利要求1所述的方法,其中,所述获取网页识别模型对网页图片进行识别的识别结果,如果该识别结果为网页错误,则将该网页图片发送给报警处理平台,并触发网页错误报警包括:
运行网页测试脚本,生成多个网页,并对各个网页抓取网页图片;
调用网页识别模型,对抓取的多个网页图片进行识别,生成识别结果;
如果识别结果为网页错误的网页图片数量和/或比率超过预设的阈值,则将被识别为网页错误的网页图片发送给报警处理平台,并触发网页错误报警。
7.一种网页识别的处理装置,包括:
网页识别控制模块,用于获取网页识别模型对网页图片进行识别的识别结果,如果该识别结果为网页错误,则将该网页图片发送给报警处理平台,并触发网页错误报警;
错误案例生成模块,用于获取报警处理平台针对该网页错误报警的处理结果,如果处理结果为将该网页错误报警作为误报处理,则将该网页图片作为错误案例进行保存;
模型训练模块,用于使用该错误案例对所述网页识别模型进行训练,以更新所述网页识别模型。
8.根据权利要求7所述的装置,其中,所述获取报警处理平台针对该网页错误报警的处理结果,包括:
监控所述报警处理平台针对所述网页错误报警的处理行为,如果监控到选择忽略该网页错误报警的处理行为或者监控到将该网页图片标记为正常网页的处理行为,则确定为误报处理。
9.一种电子设备,包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于执行所述程序,以用于如下处理:
获取网页...
【专利技术属性】
技术研发人员:杨加枫,赵阳,胡志刚,曹浪,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。