同场景音频处理方法、装置、计算机可读存储介质及系统制造方法及图纸

技术编号:20122599 阅读:33 留言:0更新日期:2019-01-16 12:54
本发明专利技术公开了一种同场景音频处理方法,包括:多个终端设备进行云录音时产生云处理音频并上传云端服务器,使得云端服务器抓取同场景音频后将这些同场景处理音频云合成为一条高质量的音频反馈给各个终端。其合成音频的处理操作,都是对原音频其缺失的内容补充后并进行降噪、除杂等处理以达到提高音频质量的目的。本发明专利技术还公开了一种同场景音频处理装置、计算机可读存储介质及系统。本发明专利技术通过将多段同场景音频组合,输出相对精准的高质量语音音频,避免录音设备在录音时因设备因素、环境因素或使用原因而导致录音内容遗漏和模糊,通过合成同场景多录音查漏补缺提高音频质量。实现提高录音设备使用效率,提高用户使用容错率的有益效果。

Audio Processing Method, Device, Computer Readable Storage Media and System for Same Scene

The invention discloses an audio processing method for the same scene, which includes generating cloud processing audio and uploading cloud server when multiple terminal devices perform cloud recording, so that the cloud server can synthesize the same scene processing audio cloud into a high quality audio feedback to each terminal after grabbing the same scene audio. The processing of synthetic audio is to supplement the missing content of the original audio and process the noise reduction and impurity removal to improve the audio quality. The invention also discloses an audio processing device for the same scene, a computer readable storage medium and a system. By combining multi-segment audio with scene audio, the invention outputs relatively accurate high-quality voice audio, avoids the omission and ambiguity of recording content caused by equipment factors, environmental factors or use reasons when recording equipment, and improves the audio quality by synthesizing multi-recording with scene. To achieve the beneficial effect of improving the efficiency of recording equipment and the user's fault tolerance rate.

【技术实现步骤摘要】
同场景音频处理方法、装置、计算机可读存储介质及系统
本专利技术涉及声音处理的
,尤其涉及一种同场景音频处理合成方法、装置、计算机可读存储介质及系统。
技术介绍
传统的数码录音笔通过对模拟信号的采样、编码将模拟信号通过数模转换器转换为数字信号,并进行一定的压缩后进行存储,播放时对压缩信息进行解码输出,以此来实现传统的录音-播放功能。数字信号即使通过反复复制,声音信息也能保存完好不受损失,并保持原样不变。但是传统的录音笔功能单一、扩展性差。并且依赖录音环境,使用场景的不可复制化导致当环境不利于有效录音时,录制的声音信息可能会有缺失、模糊等情况发生。若使用高端录音设备,会有成本太高、无法普及等使用壁垒。目前随着教育领域的科技化和物联网化,用户在某些场景对于录音的使用越来越多,并且用户通常为普通用户,难以承担高成本的录音设备。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种同场景音频处理方法,旨在解决通过现有技术进行同场景多人录音时,因个别人录音操作不当或受到环境影响时,录制的声音存在质量问题的技术问题。为实现上述目的,本专利技术提供一种多终端同场景多段录音的处理合成方法,包括以下内容:获取多个终端上传的待合成的云处理音频,所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频;将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频;将合成后的目标音频输出至对应终端。优选地,所述将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频的步骤之前,还包括:确认所述云处理音频是否在同一录音场景下录制;在确认所述云处理音频在同一录音场景下录制时,执行将获取到的云处理音频输入预设的声学模型的步骤。优选地,所述确认所述云处理音频是否在同一录音场景下录制的步骤,还包括:提取所述云处理音频的环境参数,并确认所述环境参数是否一致,所述环境参数包括时间维度及空间定位;在确认所述环境参数一致时,确认所述云处理音频在同一录音场景下录制。优选地,所述将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频的步骤,还包括:通过所述声音算法分析比对输入的云处理音频,并输出所述云处理音频的声学波形维度;整合输出的声学波形维度以合成所述目标音频。优选地,所述整合输出的声学波形维度以合成所述目标音频的步骤,包括:以预设的模糊原理训练输出的声学波形维度,并以训练后的声学波形维度生成所述目标音频。优选的,所述将合成后的目标音频输出至对应终端的步骤,还包括:获取已登记的终端信息,并根据获取到的终端信息将合成后的目标音频输出至对应终端,所述终端信息指上传云处理音频的终端。优选地,所述同场景音频处理方法,还包括:构建预设的声学模型;在已构建的声学模型中添加预设音频处理操作流程,所述音频处理操作流程包括添加声音算法及模糊原理。此外,为实现上述目的,本专利技术还提供一种同场景音频处理装置,所述同场景音频处理装置包括:存储器、处理器,所述存储器上存储有能够被处理器调用的计算机程序,所述计算机程序被所述处理器执行时实现如上所述同场景音频处理方法的步骤。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有同场景音频处理程序,所述同场景音频处理程序被处理器执行时实现如上所述同场景音频处理方法的步骤。本专利技术还提供一种同场景音频处理系统,所述同场景音频处理系统在执行时实现如上所述的同场景音频处理方法的步骤。本专利技术实施例提出的一种同场景音频处理方法,获取多个终端上传的待合成的云处理音频,所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频;将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频;将合成后的目标音频输出至对应终端。通过将多段同场景音频组合,以预设的声学模型进行降噪、补充、除杂等操作后输出相对精准的语音音频,即通过资源共享、整合与反馈进而提高了录音设备使用效率并提高用户容错率,实现了有质量问题的音频处理操作,进而提高了录音笔使用效率的有益效果。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的终端\装置结构示意图;图2为本专利技术同场景音频处理方法第一实施例的流程示意图;图3为本专利技术同场景音频处理方法第二实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例的主要解决方案是:获取多个终端上传的待合成的云处理音频,所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频;将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频;将合成后的目标音频输出至对应终端。由于现有技术中,传统的录音笔功能单一、扩展性差。并且依赖录音环境,使用场景的不可复制化导致当环境不利于有效录音时,录制的声音信息可能会有缺失、模糊等情况发生。若使用高端录音设备,会有成本太高、无法普及等使用壁垒。本专利技术提供一种解决方案,通过将多段同场景音频组合,以预设的声学模型进行降噪、补充、除杂等操作后输出相对精准的语音音频,实现了有质量问题的音频处理操作,进而提高了录音笔使用效率的有益效果。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图。本专利技术实施例终端可以是PC,也可以是智能手机、平板电脑、电子书阅读器,便携计算机等可移动式或不可移动式终端设备。如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及同场景音频处理程序。在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的同场景音频处理程序,并执行以下操作:获取多个终端上传的待合成的云处理音频,所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频;将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频;将合成后的目标音频输出至对应终端。进一步地,处理器1001可以调用存储器1005中存储的同场景音本文档来自技高网...

【技术保护点】
1.一种同场景音频处理方法,其特征在于,所述同场景音频处理方法包括以下步骤:获取多个终端上传的待合成的云处理音频,所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频;将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频;将合成后的目标音频输出至对应终端。

【技术特征摘要】
1.一种同场景音频处理方法,其特征在于,所述同场景音频处理方法包括以下步骤:获取多个终端上传的待合成的云处理音频,所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频;将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频;将合成后的目标音频输出至对应终端。2.如权利要求1所述的同场景音频处理方法,其特征在于,所述将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频的步骤之前,还包括:确认所述云处理音频是否在同一录音场景下录制;在确认所述云处理音频在同一录音场景下录制时,执行将获取到的云处理音频输入预设的声学模型的步骤。3.如权利要求2所述的同场景音频处理方法,其特征在于,所述确认所述云处理音频是否在同一录音场景下录制的步骤,还包括:提取所述云处理音频的环境参数,并确认所述环境参数是否一致,所述环境参数包括时间维度及空间定位;在确认所述环境参数一致时,确认所述云处理音频在同一录音场景下录制。4.如权利要求1所述的同场景音频处理方法,其特征在于,所述将获取到的云处理音频输入预设的声学模型,以根据所述声学模型的声音算法合成目标音频的步骤,还包括:通过所述声音算法分析比对输入的云处理音频,并输出所述云处理音频的声学波形维度;整合输出的声学波形维度以合成所述目标音频。5...

【专利技术属性】
技术研发人员:张震张大刚胡峰李星毅
申请(专利权)人:麦片科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1