一种歌曲处理方法及系统技术方案

技术编号:8271484 阅读:197 留言:0更新日期:2013-01-31 03:43
本发明专利技术涉及音频处理领域,提供了一种歌曲处理方法,包括,对海量歌曲文件进行选优,选择出较好版本的歌曲文件;对海量歌词选优出歌词文件,选择对版完整的歌词文件;格式化所述选择出的歌词文件为时间升序表;分析得出该歌曲快照区域时间;根据快照区域时间对所述歌曲文件进行切割,切割出快照文件。本发明专利技术还提供了一种歌曲处理系统。采用本发明专利技术的技术方案,自动对有歌词的大量歌曲文件进行分布式系统批量处理,大大提高了处理效率;大大提高了能够识别高潮区的歌曲量比例,同时在切中关键区以及其起止时间的准确度方面也大有改善,在切割的文件体验上做了很好的改善,切合人的听觉体验。

【技术实现步骤摘要】
本专利技术涉及音频处理领域,特别地涉及一种歌曲处理方法及系统
技术介绍
随着移动互联网的迅猛发展,手机上网越来越多,而通过手机下载歌曲也就越来越多,但用户面临的问题是昂贵的流量费和慢的网速,无法满足用户需求。为用户提供歌曲快照片段(高潮部分),能够很好的代表这首歌曲,歌曲文件大大减小,对用户来说能够很少的花费就可以听听这首歌曲好听不好听,对版不对版,而且对于现在的很慢的移动网速来说大大节约了用户时间。同时对移动运营商来说,能减少带宽并减少服务器压力,而且能提升用户体验。中国专利CN201010531964. O公开了一种音频切割装置及方法,其提供的歌曲音·频切割方法包括获取歌曲音频文件的歌词文本文件;分析该歌词文本文件中的每句歌词的重复程度,将该重复程度高于一特定阈值的重复歌词加入一候选集合;针对该候选集合中的重复歌词进行分析,获取其分布位置,连续分布的多句重复歌词组成段落;根据每句重复歌词的重复程度以及在段落中的位置,确定一句重复歌词作为切割起始歌词,以该切割起始歌词的开始时间点作为该歌曲音频文件的切割起始点;利用歌曲切割工具从该切割起始点开始,切割该歌曲音频文件。采用该方案还存在一些问题,无法精确进行歌词与歌曲文件的精确匹配,对于歌曲高潮部分的处理准确度较低,并且体验度无法满足用户需求,在处理效率上也有待提闻。因此,需要提供一种歌曲处理方案以更好地满足用户需求。
技术实现思路
本专利技术解决的技术问题在于提供了一种歌曲处理方法及系统,以解决现有技术中海量歌曲准确识别快照(歌曲关键片段)需要大量人力且低效、成本高问题。为解决上述问题,本专利技术提供了一种歌曲处理方法,包括,对海量歌曲文件进行选优,选择出较好版本的歌曲文件;对海量歌词选优出歌词文件,选择对版完整的歌词文件;格式化所述选择出的歌词文件为时间升序表;分析得出该歌曲快照区域时间;根据快照区域时间对所述歌曲文件进行切割,切割出快照文件。进一步地,上述的方法,还包括,将所述切割出的快照文件存储至存储服务器。上述的方法,其中,对海量歌曲文件进行选优,选择出较好版本的歌曲文件具体包括,将同名,同歌手的歌曲文件为同组,选择大于特定时长的歌曲文件;同组的歌曲文件中,筛选出相同时长最多的文件为候选文件作为选择出的较好版本的歌曲文件;如果选出的歌曲文件中有wma格式的,则优选wma格式的歌曲文件作为选择出的较好版本的歌曲文件;如果有多个歌曲文件,则优选好的来源的歌曲文件作为选择出的较好版本的歌曲文件。上述的方法,其中,所述对海量歌词选优出歌词文件,选择对版完整的歌词文件具体包括,将所述歌词文件统一为相同的歌词文件格式; 对所述歌词文件进行去除噪音符;根据LRC格式将所述歌词文件解析成“时间,歌词”格式,按照时间进行排序列表;将不符合要求的歌词文件按照特定时长规则进行排除;检查歌曲文件跟歌词是否对版,不对版则排除歌词文件。所述将不符合要求的歌词文件按照特定时长规则进行排除具体包括,如果最后一句歌词开始时间小于70秒则排除该歌词文件;如果最后两行歌词时间差大于等于60秒则去掉最后一行;如果歌词最后一句时间减去筛选的歌曲时长小于-60或大于10,则排除歌词文件。所述检查歌曲文件跟歌词是否对版,不对版则排除歌词文件具体包括,在歌曲文件时长大于等于歌词最后一句时间时,(歌曲文件时长X4)小于(歌词最后一句时间X7)时,以及,在歌曲文件时长小于歌词最后一句时间时,(歌曲文件时长X5)小于等于(歌词最后一句时间X3)时,则对版;否则不对版。上述的方法,其中,所述格式化所述选择出的歌词文件为时间升序表具体包括,转换歌词为统一格式;替换所有\r、\n\n、\n为\n,替换所有
、多空格为单空格;对所述歌词文件去噪,将噪符去除;解析歌词为时间升序表。上述的方法,其中,所述分析得出该歌曲快照区域时间具体包括,初步计算出快照区开始、结束时间;对确定的快照区开始、结束时间进行修正;增加歌曲淡化时间;检测快照区域时间是否异常。其中,所述初步计算出快照区开始、结束时间具体包括,按照片段计算快照时间;所述片段指连续几行的歌词且不能跨段或者根据歌名计算快照时间;或者根据重复句子计算快照时间;或者根据前、后缀计算快照时间;或者根据最后段落计算快照时间;或者根据最后30秒计算快照时间。其中,所述对确定的快照区开始、结束时间进行修正具体包括,增加最后一行时间以确定快照区结束时间;修正获取的快照区开始、结束时间。其中,所述增加歌曲淡化时间具体包括,进行淡入处理包括获取的快照片断的开始时间向前延伸f 4秒作为起始时间;如果该起始时间到了歌头,则以歌曲开始时间为开始时间;以及进行淡出处理包括获取的快照结束时间向后延伸f 4秒作为结束时间;如果超越了歌曲文件的结尾时间,则直接取歌曲文件结束时间作为结束时间。其中,所述检测快照区域时间是否异常具体包括,如果快照区停止时间小于等于歌曲文件时长则无需修正,否则快照区停 止时间需要采用歌曲文件结束时间。上述的方法,其中,所述根据快照区域时间对所述歌曲文件进行切割,切割出快照文件具体包括,对歌曲文件格式统一解压为wav ;切割计算出快照区域时间的歌曲区域的歌曲文件;淡化切割的快照歌曲文件;统一输出文件为MP3格式的文件并进行存储,且清理临时文件。本专利技术还提供了一种歌曲处理系统,包括,歌曲文件优选模块,用于对海量歌曲文件进行选优,选择出较好版本的歌曲文件;歌词文件优选模块,用于对海量歌词选优出歌词文件,选择对版完整的歌词文件;歌词文件处理模块,用于格式化所述选择出的歌词文件为时间升序表;歌曲快照分析模块,用于分析得出该歌曲快照区域时间;歌曲文件切割模块,用于根据快照区域时间对所述歌曲文件进行切割,切割出快照文件。进一步地,上述的系统,还包括,数据存储模块,用于将所述切割出的快照文件存储在存储服务器。采用本专利技术的技术方案,自动对有歌词的大量歌曲文件进行分布式系统批量处理,大大提高了处理效率;相对现有的一些自动识别,大大提高了能够识别高潮区的歌曲量比例,同时在准确度方面也大有改善,在切割的文件体验上做了很好的改善,加入淡化处理,切合人的听觉体验。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中图I是本专利技术第一实施例流程图;图2是本专利技术第二实施例结构图。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图I所示,是本专利技术第一实施例流程图,提供了一种歌曲处理方法,具体包括,步骤S101,对海量歌曲文件进行选优,选择出较好版本的歌曲文件;由于在互联网海量歌曲中,许多歌曲有不同版本,例如有不同人翻唱的、演唱会版、高潮版、现场版等等不同种情况,所以尽可能选出较好版本的歌曲文件,可以是原唱的、完整的、音质较好的歌曲文件。作为一个实施例,具体选取步骤如下 a,将同名,同歌手的歌曲文件为同组,选择大于特定时长的歌曲文件,该特定时长根据经验值可调,在7(Γ100秒内即可;b,同组的歌曲文件中,筛选出相同时长(误差范围近似一样,经验值4秒内本文档来自技高网
...

【技术保护点】
一种歌曲处理方法,其特征在于,包括,对海量歌曲文件进行选优,选择出较好版本的歌曲文件;对海量歌词选优出歌词文件,选择对版完整的歌词文件;格式化所述选择出的歌词文件为时间升序表;分析得出该歌曲快照区域时间;根据快照区域时间对所述歌曲文件进行切割,切割出快照文件。

【技术特征摘要】
1.一种歌曲处理方法,其特征在于,包括, 对海量歌曲文件进行选优,选择出较好版本的歌曲文件; 对海量歌词选优出歌词文件,选择对版完整的歌词文件; 格式化所述选择出的歌词文件为时间升序表; 分析得出该歌曲快照区域时间; 根据快照区域时间对所述歌曲文件进行切割,切割出快照文件。2.根据权利要求I所述的方法,其特征在于,还包括, 将所述切割出的快照文件存储至存储服务器。3.根据权利要求I或2所述的方法,其特征在于,对海量歌曲文件进行选优,选择出较好版本的歌曲文件具体包括, 将同名,同歌手的歌曲文件为同组,选择大于特定时长的歌曲文件; 同组的歌曲文件中,筛选出相同时长最多的文件为候选文件作为选择出的较好版本的歌曲文件; 如果选出的歌曲文件中有wma格式的,则优选wma格式的歌曲文件作为选择出的较好版本的歌曲文件; 如果有多个歌曲文件,则优选好的来源的歌曲文件作为选择出的较好版本的歌曲文件。4.根据权利要求3所述的方法,其特征在于,所述对海量歌词选优出歌词文件,选择对版完整的歌词文件具体包括, 将所述歌词文件统一为相同的歌词文件格式; 对所述歌词文件进行去除噪音符; 根据LRC格式将所述歌词文件解析成“时间,歌词”格式,按照时间进行排序列表; 将不符合要求的歌词文件按照特定时长规则进行排除; 检查歌曲文件跟歌词是否对版,不对版则排除歌词文件。5.根据权利要求4所述的方法,其特征在于,所述将不符合要求的歌词文件按照特定时长规则进行排除具体包括, 如果最后一句歌词开始时间小于70秒则排除该歌词文件;如果最后两行歌词时间差大于等于60秒则去掉最后一行;如果歌词最后一句时间减去筛选的歌曲时长小于-60或大于10,则排除歌词文件。6.根据权利要求5所述的方法,其特征在于,所述检查歌曲文件跟歌词是否对版,不对版则排除歌词文件具体包括, 在歌曲文件时长大于等于歌词最后一句时间时,(歌曲文件时长X4)小于(歌词最后一句时间X7)时,以及,在歌曲文件时长小于歌词最后一句时间时,(歌曲文件时长X5)小于等于(歌词最后一句时间X3)时,则对版;否则不对版。7.根据权利要求4至6任一所述的方法,其特征在于,所述格式化所述选择出的歌词文件为时间升序表具体包括, 转换歌词为统一格式; 替换所有\r、\n\n、\n为\n,替换所有\t、多空格为单空格; 对所述歌词文件去噪,将噪符去除;解析歌词为时间...

【专利技术属性】
技术研发人员:张云飞刘军陈伟李锦根黄兴红
申请(专利权)人:北京宜搜天下科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1