【技术实现步骤摘要】
一种光学字符识别模型的优化方法、装置、设备及介质
[0001]本公开涉及人工智能
,尤其涉及深度学习、计算机视觉
技术介绍
[0002]随着计算机技术的飞速发展,OCR(Optical Character Recognition,光学字符识别)技术被广泛应用于各种人工智能产品中。随着基于OCR技术的人工智能产品的应用,很多的异常业务数据在执行业务过程中出现。
技术实现思路
[0003]本公开提供了一种光学字符识别模型的优化方法、装置、设备及介质。
[0004]根据本公开的第一方面,提供了一种光学字符识别模型的优化方法,包括:
[0005]获取多个线上业务数据的编码向量;
[0006]采用编码器和两个解码器,对所述多个线上业务数据的编码向量进行处理,得到每个线上业务数据的两个解码向量;
[0007]根据每个线上业务数据的编码向量和两个解码向量,确定每个线上业务数据对应的两个损失值;
[0008]从所述多个线上业务数据中,获取坐标在预设坐标范围外的线上业务数 ...
【技术保护点】
【技术特征摘要】
1.一种光学字符识别模型的优化方法,包括:获取多个线上业务数据的编码向量;采用编码器和两个解码器,对所述多个线上业务数据的编码向量进行处理,得到每个线上业务数据的两个解码向量;根据每个线上业务数据的编码向量和两个解码向量,确定每个线上业务数据对应的两个损失值;从所述多个线上业务数据中,获取坐标在预设坐标范围外的线上业务数据,作为困难样本,每个线上业务数据的坐标由该线上业务数据对应的两个损失值构成;利用所述困难样本,优化光学字符识别模型。2.根据权利要求1所述的方法,所述方法还包括:获取训练集,所述训练集包括多个训练样本;获取所述多个训练样本的样本编码向量和真值编码向量;采用编码器和所述两个解码器中的第一解码器,对所述多个训练样本的样本编码向量进行处理,得到每个训练样本的第一样本解码向量;采用编码器和所述两个解码器中的第二解码器,对所述多个训练样本的样本编码向量进行处理,得到每个训练样本的第二样本解码向量;利用所述多个训练样本的第一样本解码向量、第二样本解码向量和样本编码向量,对所述编码器、所述第一解码器和所述第二解码器进行训练。3.根据权利要求2所述的方法,在所述编码器、所述第一解码器和所述第二解码器训练结束后,所述方法还包括:采用编码器和两个解码器,对所述多个训练样本的样本编码向量进行处理,得到每个训练样本的两个第三样本解码向量;根据每个训练样本的样本编码向量和两个第三样本解码向量,确定每个训练样本对应的两个损失值;基于所述多个训练样本的坐标,确定所述预设坐标范围,每个训练样本的坐标由该训练样本对应的两个损失值构成。4.根据权利要求3所述的方法,其中,所述基于所述多个训练样本的坐标,确定所述预设坐标范围的步骤,包括:基于所述多个训练样本的坐标,确定训练样本分布密度大于预设密度阈值的目标区域;将所述目标区域作为所述预设坐标范围。5.根据权利要求2所述的方法,所述方法还包括:获取可数据驱动的异常问题对应的异常业务数据;将所述异常业务数据加入所述训练集。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取带标注信息的异常业务数据;将所述异常业务数据输入垂类服务模型,得到所述异常业务数据的预测信息;对比所述标注信息和所述预测信息,得到所述异常业务数据的异常问题。7.根据权利要求1
‑
6任一项所述的方法,所述多个线上业务数据所属的垂类与数据驱
动工具对应的垂类相同,所述数据驱动工具包括所述编码器和两个解码器。8.一种光学字符识别模型的优化装置,包括:第一获取单元,用于获取多个线上业务数据的编码向量;第一处理单元,用于采用编码器和两个解码器,对所述多个线上业务数据的编码向量进行处理,得到每个线上业务数据的两个解码向量;第一确定单元,用于根据每个线上业务数据的编码向量和两个解码向量,确定每个线上业务数据对应的两个损失值;第二获取单元,用于从所述多个线上业务数据中,获取坐标在预设坐标范围外的线上业务数据,作为困难样本,每个线上业务数据的坐...
【专利技术属性】
技术研发人员:谢群义,钦夏孟,恩孟一,王鹏,姚锟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。