一种音频段落的标记方法、装置、设备及存储介质制造方法及图纸

技术编号:35450233 阅读:20 留言:0更新日期:2022-11-03 12:04
本公开提供一种音频段落的标记方法、装置、设备及存储介质,包括:响应于音频处理指令,录制或回放音频文件;接收到标记任务的开始指令,响应于开始指令的同时获取当前音频文件的时间,将该时间作为标记任务的开始时间;以开始时间为起点,在音频文件中向前查找距离开始时间最近的语音端点,将该语音端点对应的时间标记为第一时间;接收到标记任务的结束指令,响应于结束指令的同时获取当前音频文件的时间,将该时间作为标记任务的结束时间;以结束时间为起点,在音频文件中向前查找距离结束时间最近的语音端点,将该语音端点对应的时间标记为第二时间;在音频文件中标记第一时间至第二时间的音频段落,并从音频文件中提取标记的音频段落。的音频段落。的音频段落。

【技术实现步骤摘要】
一种音频段落的标记方法、装置、设备及存储介质


[0001]本公开涉及语音
,尤其涉及一种音频段落的标记方法、装置、设备及存储介质。

技术介绍

[0002]目前的录音软件或录音笔,大多都有可在录音或者回放的过程中让用户对音频加入标记并进行命名的功能,其目的主要是通过标记方式告诉用户重要信息的起始点和结束点。
[0003]录音或者回放过程中,用户在听到重要的讲话内容并判断需要标记后,再执行“开始标记”动作时已经落后数秒;录音或者回放过程中,用户判断重要的讲话内容结束并判断并执行“结束标记”动作,录制范围将多出一段无用内容。这是因为用户判断讲话内容的重要性以及实际执行动作造成时间差。并且,不同录音的场合,不同的用户需求导致实际情况会更复杂,用户执行开始标记或结束标记的时间可能提前也可能会延迟。
[0004]但市面上的录音软件或录音笔的标记功能都是以用户执行标记当下的时间做记录,无法解决前述提到的时间差问题,造成使用者回放的困扰。用户往往需重复回放数次以调整标记位置,以逼近适当的语音段落。

技术实现思路

[0005]本公开提供了一种音频段落的标记方法、装置、设备及存储介质,以至少解决现有技术中存在的以上技术问题。
[0006]根据本公开的第一方面,提供了一种音频段落的标记方法,所述方法包括:响应于音频处理指令,录制或回放音频文件;接收到标记任务的开始指令,响应于所述开始指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的开始时间;以所述开始时间为起点,在所述音频文件中向前查找距离开始时间最近的语音端点,将该语音端点对应的时间标记为第一时间;接收到标记任务的结束指令,响应于所述结束指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的结束时间;以所述结束时间为起点,在所述音频文件中向前查找距离结束时间最近的语音端点,将该语音端点对应的时间标记为第二时间;在所述音频文件中标记所述第一时间至所述第二时间的音频段落,并从所述音频文件中提取标记的所述音频段落。
[0007]在一可实施方式中,查找所述语音端点,包括:将所述音频文件进行分帧处理;提取每个音频帧的时域或频域特征;若所述特征符合预设阈值条件,则判定所述音频帧为语音片段,否则为非语音片段,所述语音片段与相邻的非语音片段的交点为语音端点。
[0008]在一可实施方式中,在接收到标记任务的开始指令,响应于所述开始指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的开始时间之后,还包括:以所述开始时间为起点,在所述音频文件中向后查找距离开始时间最近的语音端点,将该语音端点对应的时间标记为第三时间。
[0009]在一可实施方式中,在接收到标记任务的结束指令,响应于所述结束指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的结束时间之后,还包括:以所述结束时间为起点,在所述音频文件中向后查找距离结束时间最近的语音端点,将该语音端点对应的时间标记为第四时间。
[0010]在一可实施方式中,该方法还包括:在所述音频文件中标记所述第一时间至所述第四时间的音频段落;在所述音频文件中标记所述第三时间至所述第二时间的音频段落;在所述音频文件中标记所述第三时间至所述第四时间的音频段落
[0011]根据本公开的第二方面,提供了一种音频段落的标记装置,所述装置包括:录音模块,用于响应于音频处理指令,录制或回放音频文件;交互模块用于接收到标记任务的开始指令,响应于所述开始指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的开始时间;查找模块用于以所述开始时间为起点,在所述音频文件中向前查找距离开始时间最近的语音端点,将该语音端点对应的时间标记为第一时间;交互模块还用于接收到标记任务的结束指令,响应于所述结束指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的结束时间;查找模块还用于以所述结束时间为起点,在所述音频文件中向前查找距离结束时间最近的语音端点,将该语音端点对应的时间标记为第二时间;标记模块用于在所述音频文件中标记所述第一时间至所述第二时间的音频段落,并从所述音频文件中提取标记的所述音频段落。
[0012]在一可实施方式中,所述查找模块包括:分帧处理模块,用于将所述音频文件进行分帧处理;提取模块,用于提取每个音频帧的时域或频域特征;判断模块,用于若所述特征符合预设阈值条件,则判定所述音频帧为语音片段,否则为非语音片段,所述语音片段与相邻的非语音片段的交点为语音端点。
[0013]在一可实施方式中,所述查找模块还用于以所述开始时间为起点,在所述音频文件中向后查找距离开始时间最近的语音端点,将该语音端点对应的时间标记为第三时间。
[0014]根据本公开的第三方面,提供了一种电子设备,包括:
[0015]至少一个处理器;以及
[0016]与所述至少一个处理器通信连接的存储器;其中,
[0017]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的所述音频段落的标记方法。
[0018]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开的所述音频段落的标记方法。
[0019]本公开的一种音频段落的标记方法、装置、设备及存储介质,通过记录标记任务的开始时间,在音频文件中查找开始时间之前最近的语音端点,并记录语音端点的时间为第一时间,第一时间为用户真正想要标记的音频段落的开始时间;再记录标记任务的结束时间,在音频文件中查找结束时间之前最近的语音端点,并记录语音端点的时间为第二时间,第二时间为用户真正想要标记的音频段落的结束时间。在音频文件中获取并标记第一时间至第二时间之间的音频段落,即完成校正音频段落的标记任务。如此,有效地解决了由于用户判断讲话内容的重要性以及实际执行动作产生时间差,而错过标记音频段落最佳时间的问题。
[0020]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特
征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
[0022]在附图中,相同或对应的标号表示相同或对应的部分。
[0023]图1示出了本公开一实施例的音频段落的标记方法的实现流程示意图;
[0024]图2示出了本公开一实施例的查找语音端点方法的实现流程示意图;
[0025]图3示出了本公开一实施例的音频段落的标记装置的示意图;
[0026]图4示出了本公开一实施例的音频段落的标记装置中查找模块的示意图;
[0027]图5示出了本公开实施例一种实现音频段落标记方法的电子设备的组成结构示意图。
具体实施方式
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频段落的标记方法,其特征在于,所述方法包括:响应于音频处理指令,录制或回放音频文件;接收到标记任务的开始指令,响应于所述开始指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的开始时间;以所述开始时间为起点,在所述音频文件中向前查找距离开始时间最近的语音端点,将该语音端点对应的时间标记为第一时间;接收到标记任务的结束指令,响应于所述结束指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的结束时间;以所述结束时间为起点,在所述音频文件中向前查找距离结束时间最近的语音端点,将该语音端点对应的时间标记为第二时间;在所述音频文件中标记所述第一时间至所述第二时间的音频段落,并从所述音频文件中提取标记的所述音频段落。2.根据权利要求1的方法,其特征在于,查找所述语音端点,包括:将所述音频文件进行分帧处理;提取每个音频帧的时域或频域特征;若所述特征符合预设阈值条件,则判定所述音频帧为语音片段,否则为非语音片段,所述语音片段与相邻的非语音片段的交点为语音端点。3.根据权利要求1或2的方法,其特征在于,在接收到标记任务的开始指令,响应于所述开始指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的开始时间之后,还包括:以所述开始时间为起点,在所述音频文件中向后查找距离开始时间最近的语音端点,将该语音端点对应的时间标记为第三时间。4.根据权利要求3的方法,其特征在于,在接收到标记任务的结束指令,响应于所述结束指令的同时获取当前音频文件的时间,将该时间作为所述标记任务的结束时间之后,还包括:以所述结束时间为起点,在所述音频文件中向后查找距离结束时间最近的语音端点,将该语音端点对应的时间标记为第四时间。5.根据权利要求4的方法,其特征在于,该方法还包括:在所述音频文件中标记所述第一时间至所述第四时间的音频段落;在所述音频文件中标记所述第三时间至所述第二时间的音频段落;在所述音频文件中标记所述第三时间至所述第四时间的音频段...

【专利技术属性】
技术研发人员:施继泽简珮筠王韦翔施昭宇洪千茹
申请(专利权)人:联宝合肥电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1