音频流实时回放方法、装置和电子设备制造方法及图纸

技术编号:20916623 阅读:34 留言:0更新日期:2019-04-20 09:42
本发明专利技术涉及音频处理和语音处理技术领域,公开一种音频流实时回放方法,包括:将实时获取的音频流分割为多个音频节段;检测各个音频节段的内容信息量;获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;在回放过程中,根据用户的回放操作调取相应有效音频节段进行回放。本发明专利技术还提供一种音频流实时回放装置、电子设备及存储介质。本发明专利技术能在不影响原始音频流的前提下,实现实时回放和在指定时间节点的回放,还可剔除空白音频,能够适应现有的应用场景,解决前述技术问题。本发明专利技术对音频流中的空白音能实时处理,减小整段音频流形成音频文件大小,节约存储资源。本发明专利技术通过实时对音频流音频分析,用户能实时回放有效音频节段。

Audio Stream Real-time Playback Method, Device and Electronic Equipment

The invention relates to the field of audio processing and voice processing technology, and discloses an audio stream real-time playback method, which includes: dividing the real-time acquired audio stream into multiple audio segments; detecting the content information amount of each audio segment; acquiring an audio segment whose content information amount is greater than or equal to the threshold value of information amount, and marking it as an effective audio segment; and in playback process, according to the user's playback. The playback operation calls the corresponding effective audio segments for playback. The invention also provides an audio stream real-time playback device, an electronic device and a storage medium. The invention can realize real-time playback and playback at designated time nodes without affecting the original audio stream. It can also eliminate blank audio, adapt to existing application scenarios and solve the technical problems mentioned above. The invention can process the blank sound in the audio stream in real time, reduce the size of the audio file formed by the whole audio stream, and save the storage resources. By real-time audio stream analysis, the user can play back effective audio segments in real time.

【技术实现步骤摘要】
音频流实时回放方法、装置和电子设备
本专利技术涉及音频处理领域,更具体地,涉及一种音频流实时回放方法、装置和电子设备。
技术介绍
目前全球化、信息化的推进,需要使用各种各样的实时音频流数据,例如在远程授课的应用场景中,就会出现授课者和学习者的实时音频流。再举一个例子,在视像会议中就会出现与会人讨论问题、发表讲话等实时音频流。在包括以上列举的各种场景中,经常出现语速过快或者重点内容需要重复收听便于理解的情景,此时由于是实时的音频流,无法实时回放。例如在另一些场景中,由于与会者或者学生某些情况下缺席,需要针对特定时间节点的音频流调取收听。此外,音频流中还包括一些空白音频等信息。受限于音频流连续不断的特性,不能实现实时回放和特定节点的调取收听,只能等待音频流结束,再将整一段音频回放。现有技术中,一般是将整一段音频回放,但由于空白音频也占用了相当时间,导致用户需要等待,降低回放效率。
技术实现思路
鉴于上述问题,本专利技术提出了一种用于检索的方法和相应的装置,其在即使网络服务经常断网的情况下也能够通过选定的搜索服务器将基于检索请求的检索结果反馈给用户。第一方面,本专利技术提供一种音频流实时回放方法,包括:将实时获取的音频流分割为多个音频节段;检测各个音频节段的内容信息量;获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;在回放过程中,根据用户的回放操作调取相应的有效音频节段进行回放。结合第一方面,所述将实时获取的音频流分割为多个音频节段的步骤之前,还包括:获取实时的音频流;对所述实时的音频流进行底噪滤波,滤除音频流中的环境噪声。结合第一方面,所述将实时获取的音频流分割为多个音频节段的步骤,包括:获取所述底噪滤波后的音频流,得到纯音频数据;检测所述纯音频数据的波形特征,获取特征值大于空白音频的波形阈值的第一个时间节点作为起始点;从所述起始点开始,将音频流分割为若干音频节段。结合第一方面,所述音频流实时回放方法还包括:对所述有效音频节段进行语音识别并转化为文本信息;在回放过程中,将所述文本信息与用户调取有效音频节段同步进行展示。结合第一方面,所述将实时获取的音频流分割为多个音频节段的步骤之前,还包括:获取并解析所述纯音频数据的采集信息和声音特征信息,根据所述采集信息和声线波纹确定发声者;其中,所述采集信息包括采集位置和采集距离;将所述发声者在纯音频数据中出现的时间节点,将发声者的身份标识添加到所述纯音频数据中;在分割纯音频数据时,将所述身份标识添加到分割得到的有效音频节段中。结合第一方面,所述对所述有效音频节段进行语音识别并转化为文本信息的步骤之后,所述音频流实时回放方法还包括:对添加身份标识的有效音频节段进行语音识别得到带有身份标识的文本信息;将所述带有身份标识的文本信息根据时间次序,生成文稿信息;同步展示用户调取相应的有效音频节段和所述文稿信息。结合第一方面,所述根据用户的回放操作调取相应的有效音频节段进行回放的步骤包括:按照有效音频节段载有的时间戳信息,按照时间排序,合成得到实时的有效音频文件;在回放过程中,根据用户的回放操作调取相应的有效音频文件进行回放。第二方面,本专利技术还提供一种音频流实时回放装置,包括:分割单元,用于将实时获取的音频流分割为多个音频节段;检测单元,用于检测各个音频节段的内容信息量;获取单元,用于获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;回放单元,用于在回放过程中,根据用户的回放操作调取相应的有效音频节段进行回放。第三方面,本专利技术还提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为上述音频流实时回放方法的步骤。第四方面,本专利技术还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述音频流实时回放方法的步骤相对于现有技术,本专利技术提供的方案,通过将实时获取的音频流分割为多个音频节段;检测各个音频节段的内容信息量;获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;在回放过程中,根据用户的回放操作调取相应的有效音频节段进行回放。本专利技术的技术方案能够,在不影响原始音频流的前提下,实现实时回放和在指定时间节点的回放,还可以剔除空白音频,能够适应现有的应用场景,解决前述技术问题。本专利技术对于音频流中的空白音能够实时处理,减小整段音频流形成的音频文件大小,节约存储资源。本专利技术的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了根据本专利技术一个实施例的音频流实时回放方法的方法流程图;图2是利用本专利技术的方法对音频流进行底噪滤波的方法流程图;图3示出了本专利技术一个实施例中底噪滤波前音频流的波形示意图;图4示出了一个实施例对纯音频数据分割音频节段的波形示意图;图5是本专利技术中利用音频流波形特征检测起始点用于分割音频节段的方法流程图;图6是利用本专利技术的方法对有效音频节段语音识别获得文本信息的方法流程图;图7是利用本专利技术的方法对纯音频数据添加发声者身份标识的方法流程图;图8是利用本专利技术的方法生成带身份标识的文稿信息与有效音频节段同时展示的方法流程图;图9是利用本专利技术的方法根据有效音频节段的时间戳信息合成有效音频文件进行回放的方法流程图;图10是本专利技术提供的一种音频流实时回放装置的装置结构图;图11示出的是与本专利技术实施例提供的终端相关的手机的部分结构的框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。在本专利技术的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1示出了根据本专利技术一个实施例的音频流实时回放方法的方法流程图。为了能够对实时的音频流进行及时的回放,本实施例提供一种音频流实时回放方法,包括步骤:步骤S11:将实时获取的音频流分割为多个音频节段。在上述过程中,实时获取的音频流不需要截止,可以同步并轨进行分割,分割的多个音频节段可以缓存进行进一步处理。因此,应用本方法不会影响原始的音频流。步骤S12:检测各个音频节段的内容信息量。检测音频节段的内容信息量可以通过本文档来自技高网
...

【技术保护点】
1.一种音频流实时回放方法,其特征在于,包括:将实时获取的音频流分割为多个音频节段;检测各个音频节段的内容信息量;获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;在回放过程中,根据用户的回放操作调取相应的有效音频节段进行回放。

【技术特征摘要】
1.一种音频流实时回放方法,其特征在于,包括:将实时获取的音频流分割为多个音频节段;检测各个音频节段的内容信息量;获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;在回放过程中,根据用户的回放操作调取相应的有效音频节段进行回放。2.根据权利要求1所述的音频流实时回放方法,其特征在于,所述将实时获取的音频流分割为多个音频节段的步骤之前,还包括:获取实时的音频流;对所述实时的音频流进行底噪滤波,滤除音频流中的环境噪声。3.根据权利要求2所述的音频流实时回放方法,其特征在于,所述将实时获取的音频流分割为多个音频节段的步骤,包括:获取所述底噪滤波后的音频流,得到纯音频数据;检测所述纯音频数据的波形特征,获取特征值大于空白音频的波形阈值的第一个时间节点作为起始点;从所述起始点开始,将音频流分割为若干音频节段。4.根据权利要求2所述的音频流实时回放方法,其特征在于,还包括:对所述有效音频节段进行语音识别并转化为文本信息;在回放过程中,将所述文本信息与用户调取有效音频节段同步进行展示。5.根据权利要求4所述的音频流实时回放方法,其特征在于,所述将实时获取的音频流分割为多个音频节段的步骤之前,还包括:获取并解析所述纯音频数据的采集信息和声音特征信息,根据所述采集信息和声线波纹确定发声者;其中,所述采集信息包括采集位置和采集距离;将所述发声者在纯音频数据中出现的时间节点,将发声者的身份标识添加到所述纯音频数据中;在分割纯音频数据时,将所述...

【专利技术属性】
技术研发人员:彭捷闫冬
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1