【技术实现步骤摘要】
手写样本图片标注方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种手写样本图片标注方法、装置、计算机设备及存储介质。
技术介绍
在对手写文本识别的研究中,需要准备大量的手写样本以支撑手写文本识别模型的模型训练。但是,目前的手写样本往往以人工收集为主,由于手写样本的种类繁多,造成人工收集手写样本的工作量大,在人工收集到大量的手写样本后,还需要采用人工方式花费大量的时间和精力对收集到的手写样本进行样本内容标注,导致手写样本的标注效率低,造成用于模型训练和测试的手写样本的生成效率低,同时,人工标注的方式也无法保证标注内容的准确性及完整性。
技术实现思路
本专利技术实施例提供一种手写样本图片标注方法、装置、计算机设备及存储介质,以解决目前对手写样本的标注效率低,以及标注内容的准确性和完整性均不高的问题。一种手写样本图片标注方法,包括:获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;根据所述二值化图像中每 ...
【技术保护点】
1.一种手写样本图片标注方法,其特征在于,所述手写样本图片标注方法包括:获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;根据所述二值化图像中每个像素点的像素值,确定所述手写文本在所述二值化图像中对应的目标像素点,并根据所述目标像素点在所述二值化图像中的位置坐标,确定所述手写文本在所述待标注的手写样本图片中的相对位置信息;根据预设的命名方式,设置所述待标注的手写样本图片的图片名称;按照预设的第一组合方式,对所述图片名称、所述文本 ...
【技术特征摘要】
1.一种手写样本图片标注方法,其特征在于,所述手写样本图片标注方法包括:获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;根据所述二值化图像中每个像素点的像素值,确定所述手写文本在所述二值化图像中对应的目标像素点,并根据所述目标像素点在所述二值化图像中的位置坐标,确定所述手写文本在所述待标注的手写样本图片中的相对位置信息;根据预设的命名方式,设置所述待标注的手写样本图片的图片名称;按照预设的第一组合方式,对所述图片名称、所述文本内容、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息;将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中。2.如权利要求1所述的手写样本图片标注方法,其特征在于,所述对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像包括:获取所述待标注的手写样本图片中每个像素点的RGB分量值,并根据所述RGB分量值对所述待标注的手写样本图片进行灰度化处理,得到灰化图像;根据预设的灰度阈值,对所述灰化图像进行二值化处理,得到二值化图像。3.如权利要求1所述的手写样本图片标注方法,其特征在于,所述按照预设命名方式,设置所述待标注的手写样本图片的图片名称之后,并且所述将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中之前,所述手写样本图片标注方法还包括:从预设的数据字典中获取所述文本内容中每个字符对应的字符编码,其中,所述数据字典包含标准字符和每个所述标准字符的字符编码;按照预设的第二组合方式,对所述图片名称、所述文本内容中每个字符对应的字符编码、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息。4.如权利要求1至3任一项所述的手写样本图片标注方法,其特征在于,所述获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容之前,所述手写样本图片标注方法还包括:从预设的文本语料库中获取语料文本,并设置所述语料文本的手写字体属性;按照所述手写字体属性,将所述语料文本绘制在预设的画布上,得到所述待标注的手写样本图片和该待标注的手写样本图片中包含的手写文本的文本内容。5.如权利要求4所述的手写样本图片标注方法,其特征在于,所述按照所述手写字体属性,将所述语料文本绘制在预设的画布上,得到所述待标注的手写样本图片和...
【专利技术属性】
技术研发人员:金晨,刘克亮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。