当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于扫描线的音符识别方法技术

技术编号:11695868 阅读:165 留言:0更新日期:2015-07-08 17:53
本发明专利技术公开了一种基于扫描线的音符识别方法。该方法通过对输入的音符草图采用扫描线分析的方法分析音符草图四边轮廓的形状,将四边轮廓分析成用“上跳”、“下跳”、“高平”和“低平”表示的轮廓状态组成简化的轮廓状态序列;然后将轮廓状态序列与预先构建的音符模型轮廓匹配得到对应的音符。本发明专利技术采用基于特征抽取的扫描线算法,在原有的理论基础上创新地结合碰撞扫描与贯穿扫描,计算编辑距离,采用阈值判断,跳出原有的特征抽取可能存在的几何形状类似,拐点重复等现状,提高识别效率。

【技术实现步骤摘要】

本专利技术涉及手写识别技术,特别涉及手写音符识别技术。
技术介绍
现有技术下,手写识别系统大都基于特征抽取的模版匹配算法。特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。几何形状特征主要有两种表示方法,一类是轮廓特征,一类是区域特征。图像的轮廓主要针对物体的外边界,而图像的区域则关系到整个形状区域。轮廓特征抽取主要检测图像边缘,这类算法的要求是,尽可能多地标识出图像中的实际边缘,标识出的图像边缘要与实际图像中的边缘尽可能接近,图像中的边缘标识且只标识一次,可能存在的噪点不应标识为边缘。流行的基于边缘的特征提取算法有Canny算子、Sobel算子、方向链码、傅里叶算子及小波描述方法。基于区域的形状特征有几何不变距、广义傅里叶描述子、Zemike距等,这些方案通过区域平移旋转的不变性进行匹配,降低信息冗余、提高抗噪性,一个典型的显著区域算法可参考FT算法(frequency-tunedsalient reg1n detect1n)。特征抽取中的距离度量往往基于点-点之间的编辑距离,利用边缘或区域点的位置和梯度方向作为匹配信息,与根据图像学习训练提取的模版进行相似度计算,实现图像识别。特征提取过程中采用二值的判别标准,即对于一个给定的样本,它要么属于一个类,要么不属于一个类。但识别对象的数据采集经常受多种客观条件的影响,边缘抖动、复杂噪点、光影造成的边界模糊等会严重影响识别的准确度。尤其在手写音符识别中,书写随意性更大,其形状特征也不同于传统几何图形的认知方式。因此,现有技术下的这类特征提取的方法在手写音符识别中适应效果不佳。
技术实现思路
本专利技术所要解决的问题是现有技术下对手写音符识别效果不佳为解决上述问题,本专利技术采用的方案如下: ,包括如下步骤: S1:获取用户输入的音符草图; 52:对音符草图的左右两边轮廓用轮廓分析器扫描分析轮廓的形状,将轮廓的形状用轮廓状态简化表示成轮廓状态序列;所述轮廓状态分为“上跳”、“下跳”、“高平”和“低平”; 53:将轮廓状态序列与预先构建的音符模型轮廓匹配得到对应的音符。进一步,根据本专利技术的基于扫描线的音符识别方法,所述步骤S2中所述“轮廓分析器扫描分析轮廓的形状”包括以下步骤: 521:根据音符草图的大小设定抖动阈值和步进距离; 522:初始化轮廓状态序列,并将中间状态S初始化为“未知”; 523:根据步进距离对音符草图轮廓进行步进扫描,根据抖动阈值判断步进范围内轮廓走向为“上行”、“水平”还是“下行”;假如步进范围内轮廓走向向上超过抖动阈值,则标记中间状态S为“上行”;假如步进范围内轮廓走向向下超过抖动阈值,则标记中间状态S为“下行”;假如步进范围内轮廓走向向上和向下均不超过抖动阈值,则标记中间状态S为“水平”; 524:根据当前轮廓状态序列和初始点坐标以及中间状态的轮廓关联分析,将中间状态S转换成轮廓状态合并至轮廓状态序列; 525:重复步骤S23至S24直到分析完成。进一步,根据本专利技术的基于扫描线的音符识别方法,该方法还包括对音符草图的上下两边轮廓用轮廓分析器扫描分析轮廓的形状的步骤。本专利技术的技术效果如下:本专利技术采用基于特征抽取的扫描线算法,在原有的理论基础上创新地结合碰撞扫描与贯穿扫描,计算编辑距离,采用阈值判断,跳出原有的特征抽取可能存在的几何形状类似,拐点重复等现状,提高识别效率。【附图说明】图1是本专利技术的基于扫描线的音符识别方法的整体流程图。图2是本专利技术的音符模型轮廓抽象示例图。图3是对手写音符扫描分析的示例图。图4是图3中圆A内一次步进的放大图。图5是图3中圆B内一次步进的放大图。图6是手写音符异常断点的示例图。【具体实施方式】下面结合说明书附图对本专利技术做进一步详细说明。一、音符模型轮廓 本专利技术通过音符模型轮廓与分析得到手写音符轮廓进行匹配得到最终的结果,因此首先需要构建音符模型轮廓数据。每个音符对应一个模型轮廓。最终得到的音符模型轮廓数据可以以静态数据存于程序指令中,也可以以文件或数据库的方式保存。每个音符的模型轮廓用轮廓状态序列表示。轮廓状态有四种,分别为“上跳”、“下跳”、“高平”和“低平”,分别用字母表示为“U”、“D”、“H”和“L”。对于简单的音符,其模型轮廓用左右两边的轮廓状态序列表示;对于复杂的音符,其模型轮廓用上下左右四边的轮廓状态序列表示。构建音符模型轮廓时,首先对标准音符进行抽象得到抽象图,然后提取抽象图相应的轮廓状态序列。图2是构建音符模型轮廓的示例。如图2所示,a是标准音符的形状,6是抽象后的音符形状,c是将6顺时针旋转90度后左边轮廓的形状,ο是将6逆时针旋转90度后右边轮廓的形状,由此可以得到该音符的左右两边的轮廓状态序列均为:“UHDL”。上述“提取抽象图相应的轮廓状态序列”的过程与上述步骤S2中相同。因此实际操作中,可以借助步骤S2实现自动化构建音符模型轮廓数据,也即向步骤S2输入标准的音符图案得到相应的轮廓状态序列。二、音符草图音符草图通过用户笔迹采样,经预处理后获得。采样用户笔迹得到的可以是向量数据,也可以是位图。假如得到的是向量数据最终同样可以转换成位图。得到的位图为一级采样图。由于用户笔迹采样得到的一级采样图中可能包含多个音符,因此,本实施例中对一级采样图进行预处理,在预处理中,将包含有多个音符的一级采样图进行切割拆分得到多个音符草图。由此可以确保每个音符草图只包含一个音符。上述过程也即前述步骤SI所完成的功能。事实上,本领域技术人员理解,步骤SI中的“获取用户输入的音符草图”可以表示音符草图为本专利技术的输入,至于如何获取音符草图的过程并非本专利技术所讨论的范畴,因此不再赘述。为了简单起见,本实施例中,输入的音符草图以带有宽和高的点阵位图的形式表示,当然本领域技术人员可以理解,也可以采用其他的方式表示。三、轮廓分析器 如图1所示,本专利技术的过程在步骤Si获得音符草图后,首先分析左右两边的轮廓形状,匹配左右两边的轮廓状态序列;再分析上下两边的轮廓形状,匹配上下左右四边的轮廓状态序列。这与前述的“对于简单的音符,其模型轮廓用左右两边的轮廓状态序列表示;对于复杂的音符,其模型轮廓用上下左右四边的轮廓状态序列表示”相对应。无论“分析左右两边的轮廓形状”还是“分析上下四边的轮廓形状”均由轮廓分析器实现。轮廓分析器分析音符草图的轮廓只能分析一边。轮廓分析器的输入是音符草图。轮廓分析器分析所输入的音符草图时总是从左到右,自上而下地扫描。因此,轮廓分析器分析的是所输入音符草图上边轮廓形状,输出为所输入音符草图上边的轮廓状态序列。也因此,当轮廓分析器分析音符草图的左边时,首先需要对音符草图顺时针旋转90度后输入轮廓分析器;当轮廓分析器分析音符草图的右边时,首先需要对音符草图逆时针旋转90度后输入轮廓分析器;当轮廓分析器分析音符草图的下边时,首先需要对音符草图进行上下翻转后输入轮廓分析器;当轮廓分析器分析音符草图的上边时,音符草图保持不变地输入轮廓分析器。也因此“分析左右两边的轮廓形状”的过程和“分析上下两边的轮廓形状”的过程实质相同,均本文档来自技高网
...
一种基于扫描线的音符识别方法

【技术保护点】
一种基于扫描线的音符识别方法,其特征在于,包括如下步骤:S1:获取用户输入的音符草图;S2:对音符草图的左右两边轮廓用轮廓分析器扫描分析轮廓的形状,将轮廓的形状用轮廓状态简化表示成轮廓状态序列;所述轮廓状态分为“上跳”、“下跳”、“高平”和“低平”;S3:将轮廓状态序列与预先构建的音符模型轮廓匹配得到对应的音符。

【技术特征摘要】

【专利技术属性】
技术研发人员:冯桂焕陈若轻梁晓雯
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1