本发明专利技术公开了一种音频数据的模式匹配方法,包括:使用转录机对磁带进行第一及第二次转录,获得第一及第二转录音频;将第一及第二转录音频的数据进行归一化处理,并将两者中长度较长的作为主文件,长度较短的作为辅文件;将辅文件相对于主文件对齐;分割主文件,得到多个主文件样本段;在辅文件中搜索与各个主文件样本段波形匹配的辅文件样本段,得到各个主文件样本段与各个辅文件样本段间的匹配关系;分析匹配关系,得到可用的主文件样本段和辅文件样本段,并将其输出作为用于对磁带的转录音频进行修复的数据。本发明专利技术通过对磁带进行两次转录得到两个转录音频并进行匹配,得到这两个转录音频中可用的样本段,为磁带的转录音频的修复创造了条件。
【技术实现步骤摘要】
本专利技术涉及一种匹配方法,尤其涉及一种音频数据的模式匹配方法。
技术介绍
DAT (digtal audio tape)指的是数字音频磁带,这是一种高密度数字磁带录音介质,频率采样为三种模拟LP32KHZ、数字44.1KHZ及模拟48KHZ,主要流行于上世纪九十年代。由于开发代价及制造代价高昂及出于对版权的考虑,其在当时面向的主要用途为专业领域,多为灌制CD前的母带制作。因此目前世界各国的电台、电视台等机构留存着很多存有珍贵录音资料的DAT磁带,由于磁带不利于保存,并且面临着DAT技术逐步退出市场,适用的DAT转录机越来越少,因此对这些DAT磁带的转录工作是刻不容缓的。然而,在使用DAT转录机将DAT磁带上的数据转录为数字音频数据时,由于该类型的DAT转录机器本身固有的缺陷,使转录数据会随机产生小段的扭曲、丢失等现象。我们在实践中发现,转录数据中丢失的数据的持续时间约为O.1 1. 5秒,这严重了影响转录音频的最终试听效果。并且我们发现,这种丢失数据段出现的频率和位置也不是固定的,而是和具体的机器、录制开始时间、转录数据长度等因素有关,较长的数据丢失现象一般每10分钟左右出现一次,在一段20分钟左右的音频数据中数据丢失或损坏现象出现频率约为2 8次。因此,经过DAT转录机转录得到的数字音频需要进行修复。上述的这种DAT转录过程中发生的现象不是在个别的DAT转录机上发生的偶然现象,而是几乎每台DAT转录机在转录时都会发生上述的现象,只是出现的频率或时间不同。由于目前DAT技术逐步退出了市场,这种DAT转录机已经停产,而厂家也不再提供技术支持,因此在硬件上修复转录得到的数字音频是不可能的。而到国外专门的修复机构去修复的话,成本会很高。因此必须考虑通过数字处理等技术手段来对转录得到的音频结果进行分析、研究,以找到修复方法、手段,实现对DAT的转录音频的修复。因此,本领域的技术人员致力于开发一种音频数据的模式匹配方法,在DAT转录音频中找到可用的数据用于DAT音频修复。
技术实现思路
有鉴于现有技术的上述缺陷,本专利技术所要解决的技术间题是提供一种音频数据的模式匹配方法,通过对磁带的两次转录得到的两个转录音频进行模式匹配,获得可用于转录音频的修复的数据,尤其是对DAT磁带的两次转录得到的两个转录音频进行模式匹配,获得可用于DAT磁带的转录音频的修复的数据。为实现上述目的,本专利技术提供了一种音频数据的模式匹配方法,其特征在于,包括步骤100使用转录机对磁带进行第一次转录,获得的数字波形音频作为第一转录音频;使用所述转录机对所述磁带进行第二次转录,获得的数字波形音频作为第二转录音频;所述第一转录音频和所述第二转录音频的采样频率相同;步骤200将所述第一转录音频和所述第二转录音频的数据进行归一化处理;将完成所述归一化处理的所述第一转录音频和所述第二转录音频中长度较长的一个作为主文件,长度较短的一个作为辅文件;步骤300将所述辅文件相对于所述主文件对齐;步骤400分割所述主文件,得到多个样本段作为主文件样本段,并对各个所述主文件样本段编号;步骤500在所述辅文件中搜索与各个所述主文件样本段的波形匹配的样本段作为辅文件样本段,得到各个所述主文件样本段与各个所述辅文件样本段之间的匹配关系;步骤600分析所述匹配关系,得到可用的所述主文件样本段和可用的所述辅文件样本段;步骤700输出所述可用的所述主文件样本段和所述可用的所述辅文件样本段作 为用于对所述磁带进行音频修复的数据。进一步地,所述步骤100中的所述转录机为DAT转录机,所述磁带为DAT磁带。进一步地,所述步骤100中的采样频率为44.1kHz。进一步地,所述步骤300中的将所述辅文件相对于所述主文件对齐包括步骤310将所述辅文件中的前20%位置处取一个样本段,在所述主文件的前10% -30%的范围内搜索与所述样本段的起点位置PBm的数据匹配的数据的位置Pmin;步骤320若Pmin < O,则对齐失败;若Pmin > PBm,则设定所述主文件上与所述辅文件匹配的起点位置Pa1i为PAh = Pmin_PBm,所述辅文件上与所述主文件匹配的起点位置PBh为所述辅文件的起点位置Pbci ;若Pmin < PBm,则设定所述主文件上与所述辅文件匹配的起点位置PAh为所述主文件的起点位置Paci,所述辅文件上与所述主文件匹配的起点位置PBh为PBh=PBm-Pmin ;gpmin = PBm,则所述主文件和所述辅文件已对齐,设定所述主文件上与所述辅文件匹配的起点位置Pah为所述主文件的起点位置ρω,所述辅文件上与所述主文件匹配的起点位置PBh为所述辅文件的起点位置Pm。进一步地,所述步骤310中的所述样本段的长度为217。进一步地,所述步骤400中的对所述主文件的所述分割是等长度的分割,经过所述分割得到的所述各个主文件样本段的长度皆为214。进一步地,所述步骤400中的对各个所述主文件样本段的编号是从所述主文件的所述起点位置pAh开始依次递增的。进一步地,所述步骤500中的在所述辅文件中进行的所述搜索是从所述辅文件的所述起点位置PBh开始的。进一步地,所述步骤500中的与一个所述主文件样本段波形匹配的一个所述辅文件样本段中的各个数据与所述主文件样本段中的各个数据依次对应且相等。进一步地,所述步骤600中的分析所述匹配关系包括步骤610对于每一个所述主文件样本段和与其波形匹配的一个所述辅文件样本段,获取所述主文件样本段在所述主文件中相对于所述起点位置PAh的位置Pa和所述辅文件样本段在所述辅文件中相对于所述起点位置PBh的位置Pb ;步骤620若Pa = PB,则所述主文件样本段和所述辅文件样本段为所述可用的所述主文件样本段和所述可用的所述辅文件样本段;若Pa > Pb,则所述主文件样本段为所述可用的所述主文件样本段;若Pb > Pa,则所述辅文件样本段为所述可用的所述辅文件样本段。在本专利技术的较佳实施方式中,使用本专利技术的音频数据的模式匹配方法对DAT磁带进行了音频修复,包括步骤使用DAT转录机对DAT磁带进行第一次转录,获得的数字波形音频作为第一转录音频,使用上述DAT转录机对该DAT磁带进行第二次转录,获得的数字波形音频作为第二转录音频,其中,第一转录音频和第二转录音频的采样频率皆为44.1kHz ;将第一转录音频和第二转录音频的数据进行归一化处理,并将其中长度较长的一个作为主文件,长度较短的一个作为辅文件;确定主文件上与辅文件匹配的起点位置PAh,确定辅文件上与主文件匹配的起点位置PBh,使辅文件相对于主文件对齐;等长度分割主文件,得到多个长度皆为214的样本段作为主文件样本段,并对各个主文件样本段编号;在从辅文件上与主文件匹配的起点位置PBh开始搜索辅文件中与各个主文件样本段的波形匹配的样本段作为辅文件样本段,得到各个主文件样本段与各个辅文件样本段之间的匹配关系;分析该匹配关系,得到可用的主文件样本段和可用的辅文件样本段;将可用的主文件样本段和可用的辅文件样本段输出,作为用于对该DAT磁带的转录音频进行修复的数据。由此可见,本专利技术的音频数据的模式匹配方法通过对DAT磁带进行两次转录得到两个转录音频,通过对这两个转录音频进行匹配,得到这本文档来自技高网...
【技术保护点】
一种音频数据的模式匹配方法,其特征在于,包括:步骤(100)使用转录机对磁带进行第一次转录,获得的数字波形音频作为第一转录音频;使用所述转录机对所述磁带进行第二次转录,获得的数字波形音频作为第二转录音频;所述第一转录音频和所述第二转录音频的采样频率相同;步骤(200)将所述第一转录音频和所述第二转录音频的数据进行归一化处理;将完成所述归一化处理的所述第一转录音频和所述第二转录音频中长度较长的一个作为主文件,长度较短的一个作为辅文件;步骤(300)将所述辅文件相对于所述主文件对齐;步骤(400)分割所述主文件,得到多个样本段作为主文件样本段,并对各个所述主文件样本段编号;步骤(500)在所述辅文件中搜索与各个所述主文件样本段的波形匹配的样本段作为辅文件样本段,得到各个所述主文件样本段与各个所述辅文件样本段之间的匹配关系;步骤(600)分析所述匹配关系,得到可用的所述主文件样本段和可用的所述辅文件样本段;步骤(700)输出所述可用的所述主文件样本段和所述可用的所述辅文件样本段作为用于对所述磁带的转录音频进行修复的数据。
【技术特征摘要】
【专利技术属性】
技术研发人员:许舒亚,李柏岩,宋晖,陈强斌,王劲松,袁征,黄钢,韩斌,
申请(专利权)人:上海音乐学院,上海协言科学技术服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。