一种音频高潮识别方法和装置制造方法及图纸

技术编号:21629450 阅读:35 留言:0更新日期:2019-07-17 11:15
本发明专利技术实施例提供了一种音频高潮识别方法和装置。该方法包括:将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;将所述目标歌曲的曲切割为等时长的多个切片;分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线;将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段。该方法和装置精确度高,适用范围广泛,节省大量人力资源。

An Audio Orgasm Recognition Method and Device

【技术实现步骤摘要】
一种音频高潮识别方法和装置
本专利技术涉及歌曲音频处理领域,特别涉及卡拉OK高潮部分的识别方法和装置。
技术介绍
现有技术中识别歌曲的高潮部分所用的方法大多是根据歌词进行查找,由于歌曲的高潮部分普遍存在重唱的情况,通过这种方法定位到歌曲的高潮部分。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:现有技术的歌曲高潮部分识别方法的查找范围很有限,现有技术的歌曲高潮部分的识别方法的精确度低,适用范围小,识别到的高潮部分难以进行其他操作,如歌曲串烧制作等。现有技术的歌曲高潮识别方法费事费力,而且由于歌词中包含大量常用词汇,高频词汇的筛选结果需要人力的二次识别,耗费大量资源。
技术实现思路
本专利技术实施例提供一种音频高潮识别方法和装置,该技术基于歌曲的频域能量分析识别歌曲高潮的方法和装置,可以适用于所有歌曲、乐曲,适用范围广泛,克服上述现有的歌曲高潮部分的定位方法精确度低,适用范围小的缺陷。为达到上述目的,本专利技术实施例一方面提供一种音频高潮识别方法,包括:将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;将所述目标歌曲的曲切割为等时长的多个切片;分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线;将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段。可选的,所述将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段包括:提取所述目标歌曲的词;对所述目标歌曲的词进行分词,并统计其中重复频率达到预设阈值的词为高频词;将所述高频词与其对应的时间进行匹配,得到高频词时段。可选的,所述将所述目标歌曲的曲切割为等时长的多个切片,包括:获取所述目标歌曲的曲的1/4拍的时长;以该1/4拍的时长或其倍数作为切割的时间单位,将所述目标歌曲的曲切割为等时长的多个切片。可选的,所述按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线,包括:建立横轴为时间,纵轴为频域能量值的直角坐标系;其中,所述时间的原点为所述目标歌曲的时间起始点;将每个切片的频域能量最高值作为纵坐标,将切片对应时间段的中间值作为横坐标,标记到所述直角坐标系;用平滑曲线将每个切片对应的坐标点连接起来,得到切片的频域能量最高值在时间上的切片函数曲线。可选的,所述将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段包括:将所述高频词时段标记到所述直角坐标系的横轴上;当以波峰作为中心点的波长λ超过预设波长阈值时,标记该相位标记为波峰段;将出现连续高频词的波峰段标记为高潮时段。另一方面,本专利技术实施例提供一种音频高潮识别装置,包括:高频词标记单元,用于将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;切片单元,用于将所述目标歌曲的曲切割为等时长的多个切片;傅氏变换单元,用于分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;函数构建单元,用于按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线;高潮识别单元,用于将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段。可选的,高频词标记单元包括:词提取子单元,用于提取所述目标歌曲的词;分词子单元,用于对所述目标歌曲的词进行分词,并统计其中重复频率达到预设阈值的词为高频词;高频词标记子单元,用于将所述高频词与其对应的时间进行匹配,得到高频词时段。可选的,所述切片单元包括:拍时长获取子单元,用于获取所述目标歌曲的曲的1/4拍的时长;切割子单元,用于以该1/4拍的时长或其倍数作为切割的时间单位,将所述目标歌曲的曲切割为等时长的多个切片。可选的,所述函数构建单元,包括:坐标系建立子单元,用于建立横轴为时间,纵轴为频域能量值的直角坐标系;其中,所述时间的原点为所述目标歌曲的时间起始点;坐标标记子单元,用于将每个切片的频域能量最高值作为纵坐标,将切片对应时间段的中间值作为横坐标,标记到所述直角坐标系;函数曲线构建子单元,用于用平滑曲线将每个切片对应的坐标点连接起来,得到切片的频域能量最高值在时间上的切片函数曲线。可选的,所述高潮识别单元包括:标记子单元,用于将所述高频词时段标记到所述直角坐标系的横轴上;波峰段标记子单元,用于当以波峰作为中心点的波长λ超过预设波长阈值时,标记该相位标记为波峰段;高潮识别子单元,用于将出现连续高频词的波峰段标记为高潮时段。由以上技术方案可以看出,本专利技术中,歌曲声音的大小对应傅里叶能量转换后的频域能量值,频域能量值越大则歌曲的声音越大,通常歌曲的高潮部分的声音大于歌曲的其他片段,通过各个歌曲切片的频域能量值大小来刻画待检测歌曲切片在高频歌词时间段中的声音频率,根据时间与频域能量值的线性函数分析,高频歌词部分声音频率加大,即可判定为歌曲的高潮部分,即实现了自动在卡拉OK歌曲中判断歌曲高潮时间段的目的,无需像现有技术那样仅通过高频歌词来判断歌曲高潮部分,精确度和准确度大大提升。进一步地,由于歌曲高潮部分本身在各个频段的语音信号能量相对较高,从频域能量图中可以直观的看到各切片的能量值,而本专利技术通过各个歌曲切片的最大能量值进行分析,由于歌曲声音的大小与频域能量值是一一对应的关系,用能量值来确定歌曲声音大的部分,这完全符合歌曲高潮时间段部分声音大于其他歌曲时间段的特点,验证了本专利技术根据各个歌曲切片的频域能量值来分析歌曲的高潮部分是合理的。更进一步地,由于歌词分词处理后的词汇有常用词出现频率较高,但并不是歌曲的高潮部分,本专利技术通过歌词出现的频率和歌曲切片的频域能量值的对比来确定歌曲的高潮部分,去掉了歌曲中高频常用词的误差,使用歌词的频率去掉能量值较高部分的伴奏,从而本专利技术的歌曲高潮部分的截取去除歌词与伴奏的误差,这能够保证歌曲高潮部分的截取更加准确。综上,上述技术方案具有如下有益效果:因为采用高频歌词和傅里叶转换的频域能量值互相对比分析的技术手段,所以本专利技术的技术方案具有适用范围广泛和精确度和准确度大大提升的技术效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是为本专利技术实施例提供的歌曲切片频域能量图;图2为本专利技术实施例一种音频高潮识别方法的流程图;图3为本专利技术实施例一种音频高潮识别装置的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图2为本专利技术实施例一种音频高潮识别方法的流程图,如图所示,包括:步骤101,将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;步骤102,将所述目标歌曲的曲切割为等时长的多个切片;步骤103,分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;图本文档来自技高网...

【技术保护点】
1.一种音频高潮识别方法,其特征在于,该方法包括:将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;将所述目标歌曲的曲切割为等时长的多个切片;分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线;将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段。

【技术特征摘要】
1.一种音频高潮识别方法,其特征在于,该方法包括:将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段;将所述目标歌曲的曲切割为等时长的多个切片;分别对每一切片进行快速傅里叶变换,得到所述每一切片的频域能量最高值;按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线;将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段。2.根据权利要求1所述的方法,其特征在于,所述将目标歌曲的词进行分词,标记高频词语出现的时间段为高频词时段包括:提取所述目标歌曲的词;对所述目标歌曲的词进行分词,并统计其中重复频率达到预设阈值的词为高频词;将所述高频词与其对应的时间进行匹配,得到高频词时段。3.根据权利要求1所述的方法,其特征在于,所述将所述目标歌曲的曲切割为等时长的多个切片,包括:获取所述目标歌曲的曲的1/4拍的时长;以该1/4拍的时长或其倍数作为切割的时间单位,将所述目标歌曲的曲切割为等时长的多个切片。4.根据权利要求1所述的方法,其特征在于,所述按时序顺次连接所述每一切片的频域能量最高值,得到切片的频域能量最高值在时间上的切片函数曲线,包括:建立横轴为时间,纵轴为频域能量值的直角坐标系;其中,所述时间的原点为所述目标歌曲的时间起始点;将每个切片的频域能量最高值作为纵坐标,将切片对应时间段的中间值作为横坐标,标记到所述直角坐标系;用平滑曲线将每个切片对应的坐标点连接起来,得到切片的频域能量最高值在时间上的切片函数曲线。5.根据权利要求4所述的方法,其特征在于,所述将所述高频词时段与所述切片函数曲线的波峰段重合的时段作为高潮时段包括:将所述高频词时段标记到所述直角坐标系的横轴上;当以波峰作为中心点的波长λ超过预设波长阈值时,标记该相位标记为波峰段;将出现连续高频词的波峰段标记为高潮时段。6.一种音频高潮识别装置,其特征在于,包括:...

【专利技术属性】
技术研发人员:高超马哲
申请(专利权)人:北京雷石天地电子技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1