一种制造技术

技术编号：39743029 阅读：30 留言：0更新日期：2023-12-17 23:43

本发明专利技术公开了一种

全部详细技术资料下载

【技术实现步骤摘要】
一种OCR识别乐谱的方法与装置

[0001]本专利技术属于音乐信息学
，具体涉及一种
OCR
识别乐谱的方法与装置
。

技术介绍

[0002]随着数字化技术的发展，乐谱的数字化存储和处理变得越来越重要
。
乐谱不仅包含音符信息，还包括节奏
、
动态
、
指法和其他音乐表现形式，这使得乐谱的识别远比普通文本复杂
。
传统的光学字符识别
(OCR)
技术主要针对文本内容，对于复杂的乐谱结构和元素，其识别效果并不理想
。
[0003]为了实现乐谱的自动化识别和转录，需要一种专门针对乐谱的
OCR
技术
。
这种技术应该能够准确地识别乐谱中的各种元素，如音符
、
和弦
、
节奏线等，并将其转化为数字格式，以便于存储
、
编辑和分享
。
[0004]然而，现有
OCR
技术主要是针对通用域的
,
这些...

【技术保护点】

【技术特征摘要】
1.
一种
OCR
识别乐谱的方法，其特征在于，包括以下步骤：步骤
S1
：图像预处理；步骤
S2
：字符分割；步骤
S3
：字符分割分类；步骤
S4
：字符识别
。2.
根据权利要求1所述的
OCR
识别乐谱的方法，其特征在于：在步骤
S1
中，所述图像预处理包括：
a)
对输入图像进行水平校正；
b)
对输入图像进行去噪
、
滤波
、
二值化
。3.
根据权利要求2所述的
OCR
识别乐谱的方法，其特征在于：所述对输入图像进行水平校正包括：
a)
对图像进行去噪；
b)
对线条进行膨胀；
c)
使用霍夫变换进行直线检测；
d)
基于规则筛选检测到的直线；
e)
计算图像的倾斜角度；
f)
对图像进行倾斜校正
。4.
根据权利要求2所述的
OCR
识别乐谱的方法，其特征在于：所述对输入图像进行去噪
、
滤波
、
二值化包括：
a)
对图像进行形态学变换；
b)
图像灰度化；
c)
计算图像统计特征；
d)
图像去噪
(
基于统计特征去噪
、
高斯去噪
、
图像像素相关性的去噪
)
；
e)
图像滤波；
f)
图像二值化；
g)
图像形态学变换
。5.
根据权利要求1所述的
OCR
识别乐谱的方法，其特征在于：在步骤
S2
中，所述字符分割包括：
a)
图像转换为
y
轴的1维向量；
b)
基于该向量对图像进行
y
轴上的图像分割；
c)
基于边缘...

【专利技术属性】
技术研发人员：杨沛，
申请(专利权)人：成都开心音符科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人