同场景音频处理方法、装置、计算机可读存储介质及系统制造方法及图纸

技术编号：20122599 阅读：33 留言：0更新日期：2019-01-16 12:54

本发明专利技术公开了一种同场景音频处理方法，包括：多个终端设备进行云录音时产生云处理音频并上传云端服务器，使得云端服务器抓取同场景音频后将这些同场景处理音频云合成为一条高质量的音频反馈给各个终端。其合成音频的处理操作，都是对原音频其缺失的内容补充后并进行降噪、除杂等处理以达到提高音频质量的目的。本发明专利技术还公开了一种同场景音频处理装置、计算机可读存储介质及系统。本发明专利技术通过将多段同场景音频组合，输出相对精准的高质量语音音频，避免录音设备在录音时因设备因素、环境因素或使用原因而导致录音内容遗漏和模糊，通过合成同场景多录音查漏补缺提高音频质量。实现提高录音设备使用效率，提高用户使用容错率的有益效果。

Audio Processing Method, Device, Computer Readable Storage Media and System for Same Scene

The invention discloses an audio processing method for the same scene, which includes generating cloud processing audio and uploading cloud server when multiple terminal devices perform cloud recording, so that the cloud server can synthesize the same scene processing audio cloud into a high quality audio feedback to each terminal after grabbing the same scene audio. The processing of synthetic audio is to supplement the missing content of the original audio and process the noise reduction and impurity removal to improve the audio quality. The invention also discloses an audio processing device for the same scene, a computer readable storage medium and a system. By combining multi-segment audio with scene audio, the invention outputs relatively accurate high-quality voice audio, avoids the omission and ambiguity of recording content caused by equipment factors, environmental factors or use reasons when recording equipment, and improves the audio quality by synthesizing multi-recording with scene. To achieve the beneficial effect of improving the efficiency of recording equipment and the user's fault tolerance rate.

全部详细技术资料下载

【技术实现步骤摘要】
同场景音频处理方法、装置、计算机可读存储介质及系统
本专利技术涉及声音处理的
，尤其涉及一种同场景音频处理合成方法、装置、计算机可读存储介质及系统。
技术介绍
传统的数码录音笔通过对模拟信号的采样、编码将模拟信号通过数模转换器转换为数字信号，并进行一定的压缩后进行存储，播放时对压缩信息进行解码输出，以此来实现传统的录音-播放功能。数字信号即使通过反复复制，声音信息也能保存完好不受损失，并保持原样不变。但是传统的录音笔功能单一、扩展性差。并且依赖录音环境，使用场景的不可复制化导致当环境不利于有效录音时，录制的声音信息可能会有缺失、模糊等情况发生。若使用高端录音设备，会有成本太高、无法普及等使用壁垒。目前随着教育领域的科技化和物联网化，用户在某些场景对于录音的使用越来越多，并且用户通常为普通用户，难以承担高成本的录音设备。上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种同场景音频处理方法，旨在解决通过现有技术进行同场景多人录音时，因个别人录音操作不当或受到环境影响时，录制的声音存在质量问题的技术问题。为实现上述目的，本专利技术提供一种多终端同场景多段录音的处理合成方法，包括以下内容：获取多个终端上传的待合成的云处理音频，所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频；将获取到的云处理音频输入预设的声学模型，以根据所述声学模型的声音算法合成目标音频；将合成后的目标音频输出至对应终端。优选地，所述将获取到的云处理音频输入预设的声学模型，以根据所述声学模型的声音...

【技术保护点】
1.一种同场景音频处理方法，其特征在于，所述同场景音频处理方法包括以下步骤：获取多个终端上传的待合成的云处理音频，所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频；将获取到的云处理音频输入预设的声学模型，以根据所述声学模型的声音算法合成目标音频；将合成后的目标音频输出至对应终端。

【技术特征摘要】
1.一种同场景音频处理方法，其特征在于，所述同场景音频处理方法包括以下步骤：获取多个终端上传的待合成的云处理音频，所述云处理音频为同一录音场景下多个录音终端录制并上传至云服务器的云处理音频；将获取到的云处理音频输入预设的声学模型，以根据所述声学模型的声音算法合成目标音频；将合成后的目标音频输出至对应终端。2.如权利要求1所述的同场景音频处理方法，其特征在于，所述将获取到的云处理音频输入预设的声学模型，以根据所述声学模型的声音算法合成目标音频的步骤之前，还包括：确认所述云处理音频是否在同一录音场景下录制；在确认所述云处理音频在同一录音场景下录制时，执行将获取到的云处理音频输入预设的声学模型的步骤。3.如权利要求2所述的同场景音频处理方法，其特征在于，所述确认所述云处理音频是否在同一录音场景下录制的步骤，还包括：提取所述云处理音频的环境参数，并确认所述环境参数是否一致，所述环境参数包括时间维度及空间定位；在确认所述环境参数一致时，确认所述云处理音频在同一录音场景下录制。4.如权利要求1所述的同场景音频处理方法，其特征在于，所述将获取到的云处理音频输入预设的声学模型，以根据所述声学模型的声音算法合成目标音频的步骤，还包括：通过所述声音算法分析比对输入的云处理音频，并输出所述云处理音频的声学波形维度；整合输出的声学波形维度以合成所述目标音频。5...

【专利技术属性】
技术研发人员：张震，张大刚，胡峰，李星毅，
申请(专利权)人：麦片科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人