一种制造技术

技术编号:39743029 阅读:30 留言:0更新日期:2023-12-17 23:43
本发明专利技术公开了一种

【技术实现步骤摘要】
一种OCR识别乐谱的方法与装置


[0001]本专利技术属于音乐信息学
,具体涉及一种
OCR
识别乐谱的方法与装置


技术介绍

[0002]随着数字化技术的发展,乐谱的数字化存储和处理变得越来越重要

乐谱不仅包含音符信息,还包括节奏

动态

指法和其他音乐表现形式,这使得乐谱的识别远比普通文本复杂

传统的光学字符识别
(OCR)
技术主要针对文本内容,对于复杂的乐谱结构和元素,其识别效果并不理想

[0003]为了实现乐谱的自动化识别和转录,需要一种专门针对乐谱的
OCR
技术

这种技术应该能够准确地识别乐谱中的各种元素,如音符

和弦

节奏线等,并将其转化为数字格式,以便于存储

编辑和分享

[0004]然而,现有
OCR
技术主要是针对通用域的
,
这些...

【技术保护点】

【技术特征摘要】
1.
一种
OCR
识别乐谱的方法,其特征在于,包括以下步骤:步骤
S1
:图像预处理;步骤
S2
:字符分割;步骤
S3
:字符分割分类;步骤
S4
:字符识别
。2.
根据权利要求1所述的
OCR
识别乐谱的方法,其特征在于:在步骤
S1
中,所述图像预处理包括:
a)
对输入图像进行水平校正;
b)
对输入图像进行去噪

滤波

二值化
。3.
根据权利要求2所述的
OCR
识别乐谱的方法,其特征在于:所述对输入图像进行水平校正包括:
a)
对图像进行去噪;
b)
对线条进行膨胀;
c)
使用霍夫变换进行直线检测;
d)
基于规则筛选检测到的直线;
e)
计算图像的倾斜角度;
f)
对图像进行倾斜校正
。4.
根据权利要求2所述的
OCR
识别乐谱的方法,其特征在于:所述对输入图像进行去噪

滤波

二值化包括:
a)
对图像进行形态学变换;
b)
图像灰度化;
c)
计算图像统计特征;
d)
图像去噪
(
基于统计特征去噪

高斯去噪

图像像素相关性的去噪
)

e)
图像滤波;
f)
图像二值化;
g)
图像形态学变换
。5.
根据权利要求1所述的
OCR
识别乐谱的方法,其特征在于:在步骤
S2
中,所述字符分割包括:
a)
图像转换为
y
轴的1维向量;
b)
基于该向量对图像进行
y
轴上的图像分割;
c)
基于边缘...

【专利技术属性】
技术研发人员:杨沛
申请(专利权)人:成都开心音符科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1