【技术实现步骤摘要】
一种识别古代图形文字的方法、装置和程序储存介质
本专利技术涉及一种文字识别方法及装置,特别是涉及一种识别古代图形文字的方法、装置和程序储存介质。
技术介绍
古代刻写、手写图形文字由于无法确定其部首、语音、笔画等相关特征,无法通过现代字典向现代规范汉字进行转化。对古代刻写、手写图形文字的识别也就无法通过上述特征进行识别,存在实际使用中的困难。现有技术中,公开号为CN104794455B的中国专利公开了一种东巴象形文字识别方法,其包括步骤:采用投影法对东巴象形文字进行特征提取;根据提取的东巴象形文字特征,结合相似法和网络反馈法对东巴象形文字进行识别,针对于结构笔画简单,形态结构各异且很容易辨识的东巴象形文字采用相似法进行识别;对于结构笔画复杂,形态结构类似的东巴象形文字采用网络反馈方法进行识别。该方法对东巴象形文字做了区分,对于简单易于识别的东巴象形文字采用相似法进行,以期快速识别,但是该相似方法过程简单不适用于较为复杂的古代刻写、手写图形文字识别,其识别错误率会上升。
技术实现思路
针对上述现有技术缺陷,本 ...
【技术保护点】
1.一种识别古代图形文字的方法,其特征在于,包括步骤:/n获取要查询的古代刻写、手写图形文字图像;/n对所述要查询的古代刻写、手写图形文字的图像数据笔画空隙进行透视化处理,并得到相应的第一视觉特征的图像数据;/n对所述第一视觉特征的图像数据归一成统一大小、像素的透视图像数据集,形成第二视觉特征数据;/n根据第二视觉特征数据的图像中的笔画多少或阴影覆盖率的百分比区间范围转化为不同的分类字符进行区分分类,形成第三视觉特征分类并排序;/n对第三特征视觉特征对的图像进行平面平移、平面旋转、缩放与古代刻写、手写图形文字的图像数据库中的各参考古代刻写、手写图形文字的图像进行匹配,并确定 ...
【技术特征摘要】
1.一种识别古代图形文字的方法,其特征在于,包括步骤:
获取要查询的古代刻写、手写图形文字图像;
对所述要查询的古代刻写、手写图形文字的图像数据笔画空隙进行透视化处理,并得到相应的第一视觉特征的图像数据;
对所述第一视觉特征的图像数据归一成统一大小、像素的透视图像数据集,形成第二视觉特征数据;
根据第二视觉特征数据的图像中的笔画多少或阴影覆盖率的百分比区间范围转化为不同的分类字符进行区分分类,形成第三视觉特征分类并排序;
对第三特征视觉特征对的图像进行平面平移、平面旋转、缩放与古代刻写、手写图形文字的图像数据库中的各参考古代刻写、手写图形文字的图像进行匹配,并确定查询古代刻写、手写图形文字的图像与各候选古代刻写、手写图形文字的图像之间的视觉特征距离,按所述视觉特征距离,对各候选古代刻写、手写图形文字的图像进行排序,按照排序结果从各候选古代刻写、手写图形文字的图像中确定出各相似古代刻写、手写图形文字的图像集;
从第四视觉特征数据分类和排序中的多组视觉特征对中去除超过阈值的匹配的视觉特征对,形成第五视觉特征数据集。
校验第五视觉特征数据集的多组相似古代刻写、手写图形文字的图像的特征图像的局部视觉特征对,得到图像之间的视觉特征距离,根据视觉特征距离,对各候选古代刻写、手写图形文字的图像进行排序;按照排序结果从各候选古代刻写、手写图形文字的图像中确定出各相似古代刻写、手写图形文字的图像集,形成第六视觉特征数据集;
从第六视觉特征数据分类和排序中的多组视觉特征对中去除超过阈值误匹配的视觉特征对,形成第七视觉特征数据集;
根据第七视觉特征数据集计算相似古代刻写、手写图形文字的图像与查询古代刻写、手写图形文字的图像之间的仿射映射变换及误差,计算结果处于预设范围内时表示匹配成功,用匹配成功的古代刻写、手写图形文字图像的所对应的现代规范汉字或词组输出。
2.根据权利要求1所述的识别古代图形文字的方法,其特征在于,所述根据第七视觉特征数据集计算相似古代刻写、手写图形文字的图像与查询古代刻写、手写图形文字的图像之间的仿射映射变换及误差包括步骤:
根据第七视觉特征数据集,计算相似古代刻写、手写图形文字的图像与查询古代刻写、手写图形文字的图像之间的仿射映射变换,根据放射映射的结果得到内群点数量,计算出所有的内群点数量后,如果内群点数量少于一定阈值,表示查询古代刻写、手写图形文字图像与该相似古代刻写、手写图形文字图像匹配失败,反之,表示匹配成功进入下一步;
根据相似古代刻写、手写图形文字的图像与查询古代刻写、手写图形文字的图像之间的仿射变换的误差,计算查询图像与相似图像之间的仿射变换的误差...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。