一种音频处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:21273082 阅读:23 留言:0更新日期:2019-06-06 07:43
本发明专利技术涉及一种音频处理方法、装置、电子设备及存储介质,属于语音识别技术领域。该音频处理方法,包括:获取待处理音频文件;将所述待处理音频文件至少分割成第一音频文件和第二音频文件;依次将所述第一音频文件和所述第二音频文件加载到处理区域中。通过对待处理音频文件进行分割,将其分割成至少两段子音频,并依次对分割后的子音频进行分时处理,使得同时间段被加载到内存中的音频文件相对较少,显著降低了内存的占用率,在出现大量服务请求时,由于每次读入音频数据相对较少,从而支持更大数量的服务请求量,且单位处理占用的内存大小是固定的,解决了现有技术内存不可控带来的缺陷,从而带来更优的服务效率和服务质量。

An Audio Processing Method, Device, Electronic Equipment and Storage Media

The invention relates to an audio processing method, a device, an electronic device and a storage medium, belonging to the technical field of speech recognition. The audio processing method includes acquiring the audio file to be processed, dividing the audio file to be processed into at least the first audio file and the second audio file, and loading the first audio file and the second audio file into the processing area in turn. By dividing the processed audio file into at least two sub-audio segments and time-sharing the segmented sub-audio in turn, the audio files loaded into memory at the same time are relatively small, which significantly reduces the memory occupancy. When a large number of service requests occur, the audio data read in each time is relatively small, thus supporting a larger number. The volume of service requests and the size of memory occupied by unit processing are fixed, which solves the defects caused by uncontrollable memory in the existing technology, thus bringing about better service efficiency and quality.

【技术实现步骤摘要】
一种音频处理方法、装置、电子设备及存储介质
本专利技术属于语音识别
,具体涉及一种音频处理方法、装置、电子设备及存储介质。
技术介绍
随着人工智能研究的逐渐深入,语音识别作为人机交互的重要桥梁,其研究越来越受人们重视,而机器学习的引入,让语音识别能力得到了极大的提升,识别准确率也获得了长足的进步,各个领域通过对语音识别的应用吸引了大量的用户。在语言学习领域,语音识别的应用较为普遍,在进行语音翻译、口语练习等场景中起着举足轻重的作用,而随着用户量的与日俱增和大体量音频处理需求量的增加,为保证语音识别的服务效率和服务质量,如何在有限的硬件资源条件下,提供更加优秀的内存使用方案,以带来更优的服务效率和服务质量变得尤为关键。
技术实现思路
鉴于此,本申请实施例在于提供一种音频处理方法、装置、电子设备及存储介质,以有效地改善现有语音识别过程中,内存占用不可控的缺陷,从而带来更优的服务效率和服务质量。本专利技术的实施例是这样实现的:第一方面,本专利技术实施例提供了一种音频处理方法,包括:获取待处理音频文件;将所述待处理音频文件至少分割成第一音频文件和第二音频文件;依次将所述第一音频文件和所述第二音频文件加载到处理区域中。本申请实施例中,通过对待处理音频文件进行分割,将其分割成至少两段子音频,并依次对分割后的子音频进行分时处理,使得同时间段被加载到内存中的音频文件相对较少,显著降低了内存的占用率,在出现大量服务请求时,由于每次读入音频数据相对较少,从而支持更大数量的服务请求量,且单位处理占用的内存大小是固定的,解决了现有技术内存不可控带来的缺陷,从而带来更优的服务效率和服务质量。结合第一方面实施例提供的一种可能的实施方式,将所述待处理音频文件至少分割成第一音频文件和第二音频文件,包括:根据所述待处理音频文件的时长或大小和对应的预设分割比例将所述待处理音频文件至少分割成第一音频文件和第二音频文件。本申请实施例中,根据待处理音频文件的时长或大小和对应的预设分割比例对待处理音频文件进行分割,使得分割后的子音频的长度不是固定的,能适用不同的应用需求,灵活性高,适用性更好。结合第一方面实施例提供的一种可能的实施方式,在根据所述待处理音频文件的时长或大小和对应的预设分割比例将所述待处理音频文件至少分割成第一音频文件和第二音频文件之前,还包括:确定所述预设分割比例。本申请实施例中,可以根据不同的应用场景来确定匹配度更好的分割比例,能带来更优的服务效率和服务质量。结合第一方面实施例提供的一种可能的实施方式,确定所述预设分割比例,包括:获取当前时刻用于请求对音频文件进行处理的服务请求量;根据所述服务请求量确定所述预设分割比例。本申请实施例中,在确定分割比例时,通过当前时刻的服务请求量来确定分割比例,也即根据服务请求量来调整预设分割比例,能在有限的硬件资源条件下,提供更加优秀的内存使用方案,从而带来更优的服务效率和服务质量。结合第一方面实施例提供的一种可能的实施方式,确定所述预设分割比例,包括:根据所述待处理音频文件的时长或大小确定所述预设分割比例。本申请实施例中,根据所述待处理音频文件的时长或大小确定所述预设分割比例,也即根据待处理音频文件的时长或大小来调整预设分割比例,能在有限的硬件资源条件下,提供更加优秀的内存使用方案,从而带来更优的服务效率和服务质量。结合第一方面实施例提供的一种可能的实施方式,获取待处理音频文件,包括:在语音获取的过程中,判断当前获取的音频文件是否包含有用于表征特定应用环境的预设的标识信息;在为是时,将所述当前获取的音频文件作为所述待处理音频文件。本申请实施例中,通过识别当前获取的音频文件是否包含有用于表征特定应用环境的预设的标识信息,只有在为是时,才进行后续的分割分时处理,通过提供一种有针对性、有区别的处理方式来优化内存使用方案,从而带来更优的服务效率和服务质量。结合第一方面实施例提供的一种可能的实施方式,还包括:对加载到所述处理区域中的所述第一音频文件和所述第二音频文件进行语音识别,得到所述第一音频文件对应的第一识别结果和所述第二音频文件对应的第二识别结果;基于所述第一识别结果和所述第二识别结果得到目标文本。本申请实施例中,通过对加载到内存区域中的各个子音频文件依次进行语音识别,得到各自的识别结果,最终将各自的识别结果拼接起来即可得到最终的目标文本,该方式能够在改善内存不可控的前提下,保证方案的完整性和可行性。第二方面,本申请实施例还提供了一种音频处理装置,包括:获取模块、分割模块以及加载模块;获取模块,用于获取待处理音频文件;分割模块,用于将所述待处理音频文件至少分割成第一音频文件和第二音频文件;加载模块,用于依次将所述第一音频文件和所述第二音频文件加载到处理区域中。结合第二方面实施例提供的一种可能的实施方式,所述分割模块,还用于根据所述待处理音频文件的时长或大小和对应的预设分割比例将所述待处理音频文件至少分割成第一音频文件和第二音频文件。结合第二方面实施例提供的一种可能的实施方式,还包括:确定模块,用于确定所述预设分割比例。结合第二方面实施例提供的一种可能的实施方式,所述确定模块,还用于获取当前时刻用于请求对音频文件进行处理的服务请求量;以及还用于根据所述服务请求量确定所述预设分割比例。结合第二方面实施例提供的一种可能的实施方式,所述确定模块,还用于根据所述待处理音频文件的时长或大小确定所述预设分割比例。结合第二方面实施例提供的一种可能的实施方式,所述获取模块,还用于在语音获取的过程中,判断当前获取的音频文件是否包含有用于表征特定应用环境的预设的标识信息;以及还用于在为是时,将所述当前获取的音频文件作为所述待处理音频文件。结合第二方面实施例提供的一种可能的实施方式,还包括:识别模块和拼接模块;所述识别模块,用于对加载到所述处理区域中的所述第一音频文件和所述第二音频文件进行语音识别,得到所述第一音频文件对应的第一识别结果和所述第二音频文件对应的第二识别结果;所述拼接模块,用于基于所述第一识别结果和所述第二识别结果得到目标文本。第三方面,本申请实施例还提供了一种电子设备,包括存储器和处理器,所述存储器和所述处理器连接;所述存储器用于存储程序;所述处理器用于调用存储于所述存储器中的程序以执行上述第一方面实施例和/或结合第一方面实施例下的任一种可能的实施方式提供的方法。第四方面,本申请实施例还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被计算机运行时执行上述第一方面实施例和/或结合第一方面实施例下的任一种可能的实施方式提供的方法。本专利技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术实施例而了解。本专利技术的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本专利技术的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放本文档来自技高网...

【技术保护点】
1.一种音频处理方法,其特征在于,包括:获取待处理音频文件;将所述待处理音频文件至少分割成第一音频文件和第二音频文件;依次将所述第一音频文件和所述第二音频文件加载到处理区域中。

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:获取待处理音频文件;将所述待处理音频文件至少分割成第一音频文件和第二音频文件;依次将所述第一音频文件和所述第二音频文件加载到处理区域中。2.根据权利要求1所述的方法,其特征在于,将所述待处理音频文件至少分割成第一音频文件和第二音频文件,包括:根据所述待处理音频文件的时长或大小和对应的预设分割比例将所述待处理音频文件至少分割成第一音频文件和第二音频文件。3.根据权利要求2所述的方法,其特征在于,在根据所述待处理音频文件的时长或大小和对应的预设分割比例将所述待处理音频文件至少分割成第一音频文件和第二音频文件之前,还包括:确定所述预设分割比例。4.根据权利要求3所述的方法,其特征在于,确定所述预设分割比例,包括:获取当前时刻用于请求对音频文件进行处理的服务请求量;根据所述服务请求量确定所述预设分割比例。5.根据权利要求3所述的方法,其特征在于,确定所述预设分割比例,包括:根据所述待处理音频文件的时长或大小确定所述预设分割比例。6.根据权利要求1所述的方法,其特征在于,获取待处理音频文件...

【专利技术属性】
技术研发人员:林子盛雷杰王波
申请(专利权)人:成都超有爱科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1