当前位置: 首页 > 专利查询>全玲专利>正文

基于音频特征提取的快进快退播放方法、装置和播放器制造方法及图纸

技术编号:21007132 阅读:18 留言:0更新日期:2019-04-30 22:18
本发明专利技术涉及一种基于音频特征提取的快进快退播放方法、装置和播放器,所述快进快退播放方法,包括:根据音频特征在链表中确定定位点,或者,复读起点和终点;播放符合指定条件的一段音频;其中,所述链表是指在音频解码播放过程中,按顺序将每个数据帧的音频特征以及该数据帧在整个音频文件中的偏移量作为一个记录节点形成的一个链表。本发明专利技术所述的快进快退播放方法通过在音频解码播放过程中提取音频特征来确定定位点,或者,复读起点和终点,从而实现快进快退或复读功能;本发明专利技术所述的方法运算量小,查找效率高,准确度高,且用户操作简单,有利于提高用户的快进快退播放和复读体验。

Fast Forward and Fast Back Playback Method, Device and Player Based on Audio Feature Extraction

【技术实现步骤摘要】
基于音频特征提取的快进快退播放方法、装置和播放器
本专利技术涉及音频播放
,具体涉及一种基于音频特征提取的快进快退播放方法、装置和播放器。
技术介绍
对于大多数音频播放器,比如语言学习机,卡拉OK等各种语音相关设备通常都具有快进快退、复读功能,以方便用户在学习语言或对某段音乐感兴趣时,能够不断重复聆听以便于记忆。通常采用的复读方法是:将外部存储单元中的语音信息转换为电信号;微控制器将电信号转换为数字信号,并复制一个段落或一个句子至语言复读机的存储单元中。当进入复读状态时,微控制器从语言复读机的存储单元中取出要反复收听的段落或句子,并输出至语音输出单元,由语音输出单元播放,以方便用户反复收听和跟读模仿。传统的AB复读方式是根据用户手动设定一个重复读出或播放的起点(标记为A)和一个重复读出或播放的终点(标记为B),使播放设备在A与B之间重复读或播放;传统的快进快退播放方式也需要用户手动设置快进或快退播放的音频位置。传统的方案需要用户手动分别设置播放起点或终点或快进或快退位置,操作复杂,而且用户手动查找播放起点、终点或快进快退位置,往往不能一下就找到想要重复播放的位置,用户需要尝试多次才能找到想要重复播放的位置,查找效率低,传统的快进快退播放方法给用户的使用带来很大不便,用户体验差,智能化程度低。
技术实现思路
有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种基于音频特征提取的快进快退播放方法、装置和播放器。为实现以上目的,本专利技术采用如下技术方案:一种基于音频特征提取的快进快退播放方法,包括:根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点;播放符合指定条件的一段音频;其中,所述链表是指在音频解码播放过程中,按顺序将每个数据帧的音频特征以及该数据帧在整个音频文件中的偏移量作为一个记录节点形成的一个链表。可选的,所述每个数据帧的音频特征包括:目标声、背景音和静音。可选的,确定所述每个数据帧的音频特征,包括:在音频解码播放过程中,获取音频信号的频谱分布信息;对所述频谱分布信息进行处理,并结合目标声音的频谱特征确定出该数据帧的音频特征;具体的,所述对所述频谱分布信息进行处理,并结合目标声音的频谱特征确定出该数据帧的音频特征,包括:判断该音频信息是否为静音;如果该音频信息不是静音,则进一步判断该音频信息是否包含目标声音;如果目标声音有男声和女声之分,则进一步判断该目标声音包含的是男声还是女声。可选的,所述判断该音频信息是否为静音,包括:利用解码过程中解析出的特定字段直接判断该音频信息是否为静音,或者,根据解码过程中获取的频谱幅值信息判断该音频信息是否为静音,将在特定频率范围内频谱幅值小于第一阈值的音频信息判断为静音;所述判断该音频信息是否包含目标声音,包括:如果该音频信号的频谱在目标声音的基音频点或泛音频点上对应的幅值大于第二阈值,则确定该数据帧包含有目标声音。可选的,所述根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点,包括:在解码播放过程中,在链表中根据每个数据帧的音频特征查找到符合条件的一段连续目标声数据帧,应在符合条件的连续目标声数据帧中找到最后一个符合条件的目标声数据帧,并将该数据帧所在的音频位置作为复读终点或定位点的基准点;在解码播放过程中,在链表中根据每个数据帧的音频特征查找到符合条件的一段连续目标声数据帧,应在符合条件的连续目标声数据帧中找到第一个符合条件的目标声数据帧,并将该数据帧所在的音频位置作为复读起点或定位点的基准点。可选的,在执行所述根据音频特征在链表中确定定位点,或者,复读起点和终点之前,还包括:接收用户发送的快进快退播放指令和设定条件,即播放的时间或者位置范围等信息,其中,所述快进快退播放指令包括复读指令。可选的,所述快进快退播放方法还包括:在接收到快进快退播放指令或者复读指令时,如果此时解码播放出的数据帧的音频特征是目标声,则继续播放,直到解码播放出的数据帧音频特征不是目标声时,跳转到所述定位点或复读起点重新播放。可选的,所述快进快退播放方法还包括:在接收到快进快退播放指令或者复读指令时,直接跳转到所述定位点或复读起点重新播放。本专利技术还提供了一种基于音频特征提取的快进快退播放装置,包括:播放断点查找模块,用于根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点;播放模块,用于播放符合指定条件的一段音频;其中,所述链表是指在音频解码播放过程中,按顺序将每个数据帧的音频特征以及该数据帧在整个音频文件中的偏移量作为一个记录节点形成的一个链表。本专利技术还提供了一种播放器,包括:如前面所述的快进快退播放装置;所述播放器是如下项中的一项:智能学习机、点读机、音乐播放器和KTV点唱机。本专利技术采用以上技术方案,所述基于音频特征提取的快进快退播放方法,包括:根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点;播放符合指定条件的一段音频;其中,所述链表是指在音频解码播放过程中,按顺序将每个数据帧的音频特征以及该数据帧在整个音频文件中的偏移量作为一个记录节点形成的一个链表。本专利技术所述的快进快退播放方法通过在音频解码播放过程中提取音频特征来确定定位点,或者,复读起点和终点,从而实现快进快退或复读功能;本专利技术所述的方法运算量小,查找效率高,准确度高,且用户操作简单,有利于提高用户的快进快退播放和复读体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术基于音频特征提取的快进快退播放方法实施例一提供的流程示意图;图2是本专利技术中确定每个数据帧的音频特征的流程示意图;图3是音频解码的原理示意图;图4是本专利技术基于音频特征提取的快进快退播放装置实施例一提供的结构示意图。图中:1、播放断点查找模块;2、播放模块。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。图1是本专利技术基于音频特征提取的快进快退播放方法实施例一提供的流程示意图。如图1所示,本实施例所述的基于音频特征提取的快进快退播放方法,包括:S11:根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点;S12:播放符合指定条件的一段音频;其中,所述链表是指在音频解码播放过程中,按顺序将每个数据帧的音频特征以及该数据帧在整个音频文件中的偏移量作为一个记录节点形成的一个链表。进一步的,所述每个数据帧的音频特征包括:目标声、背景音和静音。进一步的,如图2和图3所示,确定所述每个数据帧的音频特征,包括:S21:在音频解码播放过程中,获取音频信号的频谱分布信息;S22:对所述频谱分布信息进行处理,并结合目标声音的频谱特征确定出该数据帧的音频特征。进一步的,所述对所述频谱分布信息进行处理,并结合目标声音的频谱特征确定出该数据帧的音频特征,包括:判断该音本文档来自技高网...

【技术保护点】
1.一种基于音频特征提取的快进快退播放方法,其特征在于,包括:根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点;播放符合指定条件的一段音频;其中,所述链表是指在音频解码播放过程中,按顺序将每个数据帧的音频特征以及该数据帧在整个音频文件中的偏移量作为一个记录节点形成的一个链表。

【技术特征摘要】
1.一种基于音频特征提取的快进快退播放方法,其特征在于,包括:根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点;播放符合指定条件的一段音频;其中,所述链表是指在音频解码播放过程中,按顺序将每个数据帧的音频特征以及该数据帧在整个音频文件中的偏移量作为一个记录节点形成的一个链表。2.根据权利要求1所述的方法,其特征在于,所述每个数据帧的音频特征包括:目标声、背景音和静音。3.根据权利要求2所述的方法,其特征在于,确定所述每个数据帧的音频特征,包括:在音频解码播放过程中,获取音频信号的频谱分布信息;对所述频谱分布信息进行处理,并结合目标声音的频谱特征确定出该数据帧的音频特征;具体的,所述对所述频谱分布信息进行处理,并结合目标声音的频谱特征确定出该数据帧的音频特征,包括:判断该音频信息是否为静音;如果该音频信息不是静音,则进一步判断该音频信息是否包含目标声音;如果目标声音有男声和女声之分,则进一步判断该目标声音包含的是男声还是女声。4.根据权利要求3所述的方法,其特征在于,所述判断该音频信息是否为静音,包括:利用解码过程中解析出的特定字段直接判断该音频信息是否为静音,或者,根据解码过程中获取的频谱幅值信息判断该音频信息是否为静音,将在特定频率范围内频谱幅值小于第一阈值的音频信息判断为静音;所述判断该音频信息是否包含目标声音,包括:如果该音频信号的频谱在目标声音的基音频点或泛音频点上对应的幅值大于第二阈值,则确定该数据帧包含有目标声音。5.根据权利要求1所述的方法,其特征在于,所述根据音频特征在链表中确定快进快退的定位点,或者,复读起点和终点,包括:在解码播放过程中,在链表中根据每个数据帧的...

【专利技术属性】
技术研发人员:全玲
申请(专利权)人:全玲
类型:发明
国别省市:北京,11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1