【技术实现步骤摘要】
本专利技术涉及多媒体信号处理
,尤其是在数字音乐图书馆等音乐乐谱数字 化应用开发的领域。
技术介绍
乐谱的专利技术是人类音乐史上的里程碑,它的出现使人们可以在一个相对标准的平 台上进行音乐的交流和传承。但是,古往今来的优秀音乐作品大都以纸质乐谱的形式保留 下来,直至今天,纸质乐谱仍是表达和描述音乐作品的主要载体。纸质乐谱的存在使得音乐 的人们交流和保存音乐,但是纸质乐谱的保存需要占用一定的存储空间,不利于保存与交 流,特别是纸质状乐谱无法实现高速查询与检索,而只能能以纯手工的方式进行。纸质乐谱 的这些缺点,使得乐谱的交流与保存极为不便。光学乐谱识别技术(OMR)是近年来发展起来的实现纸质乐谱数字化的一种主流 技术,不同于传统的图像存储格式(如JPG,TIF,GIF等)采用光学扫描压缩存贮乐谱图像, 而是记录乐谱所表达的音乐内容,因此所需要的存储空间更小,并且可以很方便的对其进 行编辑、加工、打印、传播或者实时演奏。OMR技术为纸质乐谱的数字化提供了一个智能、高 效的新途径,可以广泛的应用在计算机辅助音乐教学、数字音乐图书馆建设、互联网音乐搜 索、计算机音乐合成等领域。一个完整的OMR处理系统大致包括以下几个组成模块1)纸质乐谱图像输入及预 处理,2)乐谱谱线检测定位及删除,3)乐谱图像分割,4)乐谱图像识别,5)乐谱重建及音乐 语义解释。乐谱的分割是识别的前提,关系到整个OMR系统的性能。目前广泛采用的乐谱 分割方式主要有投影法,区域生长法,边缘提取及连通域分析等方法。投影法方法简单,但 往往只能实现对直线区域和非直线区域的有效分割,或者是进行直线 ...
【技术保护点】
一种基于分段投影与乐符结构的谱线检测方法,其特征在于包括如下步骤:(1)扫描输入以后的图像经过滤波去噪、格式变换以后得到行和列分别为W×H的二值图像:B(x,y),(0≤x≤W;0≤y≤H),当像素点为黑色的目标点时B(x,y)=0,为白色的背景点时B(x,y)=1,其中(x、y)为像素点坐标;首先计算乐谱图像的谱线间距S,即找出图像中出现次数最多的垂直白色游程的长度;再将图像沿水平方向划分成N个条形区域Z↓[1],Z↓[2],…Z↓[n],N=Ceil(W/(4×S)),Ceil表示朝∞方向取整数,其中前N-1个区域的宽度w为4×S,最后一个区域宽度w为W-(N-1)×4×S,对最后两个区域内的子图像进行水平投影,得到投影队列:Proj↓[v][y]=*B(y,k),1≤y≤H,(2)垂直方向上的倾斜校正:根据投影队列找出第一根谱线和最后一根谱线的行位置row1和row2,沿谱线的位置分别在区域:Z1(x,y):(N-2)×w<x≤W,row1-S≤y≤row1+S,和Z2(x,y):(N-2)×w<x≤W,row2-S≤y≤row2+S中搜索出黑色像素的最大列值col1和col2, ...
【技术特征摘要】
一种基于分段投影与乐符结构的谱线检测方法,其特征在于包括如下步骤(1)扫描输入以后的图像经过滤波去噪、格式变换以后得到行和列分别为W×H的二值图像B(x,y),(0≤x≤W;0≤y≤H),当像素点为黑色的目标点时B(x,y)=0,为白色的背景点时B(x,y)=1,其中(x、y)为像素点坐标;首先计算乐谱图像的谱线间距S,即找出图像中出现次数最多的垂直白色游程的长度;再将图像沿水平方向划分成N个条形区域Z1,Z2,…Zn,N=Ceil(W/(4×S)),Ceil表示朝∞方向取整数,其中前N 1个区域的宽度w为4×S,最后一个区域宽度w为W (N 1)×4×S,对最后两个区域内的子图像进行水平投影,得到投影队列 <mrow><msub> <mi>Proj</mi> <mi>v</mi></msub><mo>[</mo><mi>y</mi><mo>]</mo><mo>=</mo><munderover> <mi>Σ</mi> <mrow><mi>k</mi><mo>=</mo><mrow> <mo>(</mo> <mi>N</mi> <mo>-</mo> <mn>2</mn> <mo>)</mo></mrow><mo>×</mo><mn>4</mn><mo>×</mo><mi>S</mi><mo>+</mo><mn>1</mn> </mrow> <mi>W</mi></munderover><mi>B</mi><mrow> <mo>(</mo> <mi>y</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo></mrow><mo>,</mo><mn>1</mn><mo>≤</mo><mi>y</mi><mo>≤</mo><mi>H</mi><mo>,</mo> </mrow>(2)垂直方向上的倾斜校正根据投影队列找出第一根谱线和最后一根谱线的行位置row1和row2,沿谱线的位置分别在区域Z1(x,y)(N 2)×w<x≤W,row1 S≤y≤row1+S,和Z2(x,y)(N 2)×w<x≤W,row2 S≤y≤row2+S中搜索出黑色像素的最大列值col1和col2,据此计算出整幅图像的垂直倾斜度φφ=arctan((row2 row1)/(col2 col1))及垂直方向上的最大倾斜长度qq=(col2 col1)×W/(row2 row1);对图像进行垂直倾斜校正B′(x,y)=B(x,y+Δ′),其中Δ′=floor(q×x/H),1≤x≤W,1≤y≤H,为不同像素在垂直方向上的校正量,B′(x,y)为垂直校正后的图像,floor表示向零方向取整;(3)水平方向上的倾斜及弯曲校正对步骤(2)所划分的各个子区域进行水平投影,得到各条形子区域的水平投影队列 <mrow><mi>Proj</mi><mo>[</mo><mi>y</mi><mo>,</mo><mi>n</mi><mo>]</mo><mo>=</mo><munderover> <mi>Σ</mi> <mrow><mi>k</mi><mo>=</mo><mi>sp</mi> </mrow> <mrow><mi>k</mi><mo>=</mo><mi>sp</mi><mo>+</mo><mi>w</mi> </mrow></munderover><mi>B</mi><mrow> <mo>(</mo> <mi>y</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo></mrow><mo>,</mo> </mrow>其中sp=(n 1)×w,1≤n≤N,1≤y≤H,n为条形区域的段号;(4)相同的的两个曲线的相关系数最大,故对相邻两段的水平投影图进行互相关运算,得到互相关队列Cross(λ,n),以获得两个投影图对应谱线间的位置差d(n); <mrow><mi>Cross</mi><mrow> <mo>(</mo> <mi>λ</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>=</mo><munderover> <mi>Σ</mi> <mrow><mi>k</mi><mo>=</mo><mi>P</mi><mn>1</mn> </mrow> <mrow><mi>P</mi><mn>2</mn> </...
【专利技术属性】
技术研发人员:邹采荣,杨银贤,赵力,奚吉,王开,陈存宝,王青云,余华,
申请(专利权)人:东南大学,
类型:发明
国别省市:32[中国|江苏]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。