一种乐谱图像识别方法及装置制造方法及图纸

技术编号：14704666 阅读：68 留言：0更新日期：2017-02-25 04:25

本发明专利技术公开的乐谱图像识别方法及装置，包括，获得待处理的五线谱图像；对待处理的五线谱图像采用边缘检测方法描绘出图像的边缘信息，再通过直线检测方法检测出五线位置坐标；采用预设的音符分类器，对待处理的五线谱图像进行音符定位分割，得到每个完整音符在图像中的位置；采用预设的卷积神经网络对分割获得的音符符头进行识别，判断是实心符头还是空心符头，并得到符头的位置；根据所述得到的五线位置坐标、每个完整音符的相对位置、是实心符头还是空心符头及符头的位置，识别出每个完整音符。本发明专利技术乐谱图像识别方法及装置，相较于传统计算机视觉方法，识别精度高且识别速度快。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像识别
，特别涉及一种乐谱图像识别方法及装置。
技术介绍
图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。现有技术中的乐谱图像识别方法，大多基于传统计算机视觉方法，在识别精度和识别速度上不是十分理想，无法做到快速精准识别，甚至需要对待识别的乐谱做出高度规范化要求，不利于日常场景的使用。
技术实现思路
本专利技术实施例的目的在于提供一种乐谱图像识别方法及装置，可以解决现有技术中存在的乐谱识别精度和识别速度不理想的问题。为达到上述目的，本专利技术实施例公开了，一种乐谱图像识别方法，包括：获得待处理的五线谱图像；对待处理的五线谱图像采用边缘检测方法描绘出图像的边缘信息，再通过直线检测方法检测出五线位置坐标；采用预设的音符分类器，对待处理的五线谱图像进行音符定位分割，得到每个完整音符在图像中的位置；采用预设的卷积神经网络对分割获得的音符符头进行识别，判断是实心符头还是空心符头，并得到符头的位置；根据所述得到的五线位置坐标、每个完整音符的相对位置、是实心符头还是空心符头及符头的位置，识别出每个完整音符。优选的，所述的音符分类器的训练过程，包括：建立正样本数据集和负样本数据集，数据集中包括定位框的位置数据及定位框内的五线谱图像的图像数据，正样本数据集为包括完整音符的图像数据，负样本数据集为包括除过完整音符之外的其余乐谱可能出现的图像数据；提取正样本数据集和负样本数据集中每个样本的通道特征，训练音符分类器。优选的，所述的每个样本的通道特征，包括，灰度和颜色、线性滤波、非线性变换、逐点变换、梯度直方图。优选的，...
一种乐谱图像识别方法及装置

【技术保护点】
一种乐谱图像识别方法，其特征在于，包括：获得待处理的五线谱图像；对待处理的五线谱图像采用边缘检测方法描绘出图像的边缘信息，再通过直线检测方法检测出五线位置坐标；采用预设的音符分类器，对待处理的五线谱图像进行音符定位分割，得到每个完整音符在图像中的位置；采用预设的卷积神经网络对分割获得的音符符头进行识别，判断是实心符头还是空心符头，并得到符头的位置；根据所述得到的五线位置坐标、每个完整音符的相对位置、是实心符头还是空心符头及符头的位置，识别出每个完整音符。

【技术特征摘要】
1.一种乐谱图像识别方法，其特征在于，包括：获得待处理的五线谱图像；对待处理的五线谱图像采用边缘检测方法描绘出图像的边缘信息，再通过直线检测方法检测出五线位置坐标；采用预设的音符分类器，对待处理的五线谱图像进行音符定位分割，得到每个完整音符在图像中的位置；采用预设的卷积神经网络对分割获得的音符符头进行识别，判断是实心符头还是空心符头，并得到符头的位置；根据所述得到的五线位置坐标、每个完整音符的相对位置、是实心符头还是空心符头及符头的位置，识别出每个完整音符。2.根据权利要求1所述的乐谱图像识别方法，其特征在于，所述的音符分类器的训练过程，包括：建立正样本数据集和负样本数据集，数据集中包括定位框的位置数据及定位框内的五线谱图像的图像数据，正样本数据集为包括完整音符的图像数据，负样本数据集为包括除过完整音符之外的其余乐谱可能出现的图像数据；提取正样本数据集和负样本数据集中每个样本的通道特征，训练音符分类器。3.根据权利要求2所述的乐谱图像识别方法，其特征在于，所述的每个样本的通道特征，包括，灰度和颜色、线性滤波、非线性变换、逐点变换、梯度直方图。4.根据权利要求2或3所述的乐谱图像识别方法，其特征在于，所述的对待处理的五线谱图像进行音符定位分割，包括，在待处理的五线谱图像上随机选取若干个候选定位框，逐个扫描定位框，对每个定位框内的图像提取所述的通道特征，将提取的通道特征输入到音符分类器中，判断定位框内的图像为正样本或者为负样本，正样本判定为乐谱中的完整音符，负样本判定为乐谱背景舍弃，从而得到待处理的五线谱图像中的完整音符，对照音符分类器中定位框的位置数据得到每个完整音符在图像中的位置。5.根据权利要求1所述的乐谱图像识别方法，其特征在于，所述的卷积神经网络的训练过程，包括，建立音符符头数据集，包括实心符头、空心符头和背景三种分类数据；构建卷积神经网络，包括2个卷积层，2个下采样层和1个全连接层；将音符符头数据集中的符头图像数据输入到卷积神经网络中，完成训练。6.根据权利要求5...

【专利技术属性】
技术研发人员：宋晴，杨录，王智慧，杨李怡，贾文赫，刘小欧，辛学仕，陈海鹏，杨敏，姜佳男，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人