质量检测方法技术

技术编号:39402557 阅读:17 留言:0更新日期:2023-11-19 15:54
本申请提供的一种质量检测方法

【技术实现步骤摘要】
质量检测方法、装置、电子设备及存储介质


[0001]本申请涉及文档检测
,特别地涉及一种质量检测方法

装置

电子设备及存储介质


技术介绍

[0002]书籍的数字化不仅可以更加方便用户阅读,而且可以通过检索快速定位想要信息

然而目前网上的数据大多是以扫描图片的
pdf
文件形式呈现,为了方便用户的提取想要的内容和内容的快速检索,可以通过
OCR
文字识别技术对图片的内容进行提取


OCR
文字识别的准确度受限于图片的质量,对于电子书中存在水印

模糊

透字等情况,
OCR
识别出来的结果会存在错误或者多内容与少内容的情况,因此,为了间接提高
OCR
输出结果的准确度,需要对电子书进行质量检测,针对电子书质量检测,相关技术中提供了图像质量检测方法,但是现有的图像质量检测方法在进行检测时,通常存在检测精度不高的问题<br/>。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种质量检测方法,其特征在于,包括:获取待检测文档,将所述待检测文档转化为图像;将每一张图像分成预设大小的区块;提取各个区块的浅层特征,并基于各个区块的浅层特征确定各个区块的聚合特征;从预先建立的核心特征集中确定与各个区块的聚合特征最近的目标样本特征;基于所述目标样本特征计算各个区块的异常得分;基于所述异常得分对所述待检测文档进行质量检测
。2.
根据权利要求1所述的方法,其特征在于,所述目标样本特征包括
n
个,所述基于所述目标样本特征计算各个区块的异常得分,包括:基于所述目标样本特征采用计算式计算各个区块的异常得分,其中,计算式包括:其中,
score
表示异常得分,
x
test
为聚合特征,
x
c
表示目标样本特征,
x
*
表示最近的一个目标样本特征,
n
为正整数
。3.
根据权利要求1所述的方法,其特征在于,所述基于所述异常得分对所述待检测文档进行质量检测,包括:比较所述异常得分与异常得分阈值之间的大小关系,得到比较结果;基于所述比较结果确定各个区块的质量是否异常;基于各个区块的质量是否异常确定所述待检测文档的质量是否异常
。4.
根据权利要求1所述的方法,其特征在于,所述提取各个区块的浅层特征,并基于各个区块的浅层特征确定各个区块的聚合特征,包括:基于训练好的残差网络模型提取各个样本区块的浅层特征;基于基于各个区块的浅层特征采用平均滤波卷积操作确定各个区块的聚合特征
。5.
根据权利要求4所述的方法,其特征在于,所述方法还包括:获取
ImageNet
数据集;以
ImageNet
数据集中的图像为残差网络模型的输入对所述残差网络模型进行训练,得到所述...

【专利技术属性】
技术研发人员:王晖石畏
申请(专利权)人:上海卓越睿新数码科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1