语音处理方法、装置和介质制造方法及图纸

技术编号:25712098 阅读:24 留言:0更新日期:2020-09-23 02:58
本发明专利技术实施例提供了一种语音处理方法和装置、一种用于语音处理的装置,其中的方法应用于耳机装置,具体包括:采集第一语音信号;确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;输出所述第二语音信号。本发明专利技术实施例能够提高语音信号的清晰度和质量,进而帮助用户实现打动听众、增强自信的目的。

【技术实现步骤摘要】
语音处理方法、装置和介质
本专利技术涉及语音处理
,特别是涉及一种语音处理方法和装置、一种机器可读介质。
技术介绍
作为最自然的交流沟通方式之一,语音被广泛应用于语音对话、语音社交、k歌(KaraokTV)、直播、游戏、视频录制等语音处理场景。目前,通常直接将采集的语音用于语音处理场景。例如,向通信对端发送采集的语音;又如,在视频中携带采集的录音等。在实际应用中,可能存在用户对采集的语音不满意的情形,此种情况下用户将存在美化语音的需求。例如,有些用户希望通过美化语音,实现打动听众、增强自信的目的。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的语音处理方法、语音处理装置及用于语音处理的装置,本专利技术实施例能够提高语音信号的清晰度和质量,进而帮助用户实现打动听众、增强自信的目的。为了解决上述问题,本专利技术公开了一种语音处理方法,包括:采集第一语音信号;确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;输出所述第二语音信号。另一方面,本专利技术实施例公开了一种语音处理装置,包括:采集模块,用于采集第一语音信号;确定模块,用于确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;输出模块,用于输出所述第二语音信号。再一方面,本专利技术实施例公开了一种用于语音处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:采集第一语音信号;确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;输出所述第二语音信号。本专利技术实施例还公开了一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行前述的方法。本专利技术实施例包括以下优点:本专利技术实施例的耳机装置可以采集第一语音信号,并针对第一语音信号,提供经过美化处理后的第二语音信号。由于上述美化处理滤除了第一语音信号中的用户噪音,因此能够提高语音信号的清晰度和质量,进而能够帮助用户实现打动听众和增强自信的目的。本专利技术实施例的耳机装置可以对第一语音信号进行实时性地美化处理,故可以应用于对实时性要求较高的语音处理场景,如语音对话场景、K歌、直播场景等。附图说明图1是本专利技术实施例的一种语音处理方法的流程的示意;图2是本专利技术的一种语音处理方法实施例一的步骤流程图;图3是本专利技术的一种语音处理方法实施例二的步骤流程图;图4是本专利技术的一种语音处理方法实施例三的步骤流程图;图5是本专利技术的一种语音处理装置的结构框图;图6是本专利技术的一种用于语音处理的装置1300的框图;及图7是本专利技术的一种服务端的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术实施例可以适用于语音处理场景。语音处理场景可以包括:语音对话、语音社交、k歌、直播、游戏、视频录制等。本专利技术实施例提供了一种语音处理方案,该方案可由耳机装置执行,该方案具体包括:采集第一语音信号;确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理具体包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;以及输出所述第二语音信号。本专利技术实施例的耳机装置可以采集第一语音信号,并针对第一语音信号,提供经过美化处理后的第二语音信号。由于上述美化处理滤除了第一语音信号中的用户噪音,因此能够提高语音信号的清晰度和质量,进而能够帮助用户实现打动听众和增强自信的目的。本专利技术实施例的耳机装置可以对第一语音信号进行实时性地美化处理,故可以应用于对实时性要求较高的语音处理场景,如语音对话场景、K歌、直播场景等。本专利技术实施例的耳机装置可以为头戴式耳机,如蓝牙耳机、运动耳机、真无线立体(TWS,TrueWirelessStereo)耳机等,也可以称为人工智能(AI,ArtificialIntelligence,)耳机。可选地,耳机装置可以包括多个麦克风阵元、处理器和扬声器。多个麦克风阵元可以拾取预设角度范围内的第一语音信号。处理器用于确定第一语音信号对应的第二语音信号。根据一种实施例,处理器可以对第一语音信号进行美化处理,以得到第二语音信号。根据另一种实施例,处理器可以与外界设备进行数据交互,以得到外界设备处理得到的第二语音信号。扬声器用于播放声音,如对第二语音信号进行播放。外界设备可以包括:终端、和/或、耳机收纳装置。当然,外界设备可以包括:服务端。在本专利技术的一种实施例中,受到体积的限制,可以不在耳机装置中设置运算芯片,将耳机装置对应的运算交由外界设备。因此,耳机装置可以与外界设备通信,由外界设备执行耳机装置对应的运算。耳机装置对应的运算可用于对第一语音信号进行美化处理等处理。在本专利技术的一种实施例中,可以在耳机装置中设置运算芯片,由运算芯片执行耳机装置对应的运算。耳机装置对应的运算可用于对第一语音信号进行美化处理等处理。换言之,耳机装置中可设置有语音处理模块,该语音处理模块用于对第一语音信号进行美化处理等处理。根据一种实施例,耳机收纳装置中可以设置有语音处理模块,该语音处理模块用于对第一语音信号进行美化处理,以得到第二语音信号。根据一种实施例,耳机收纳装置中未设置有语音处理模块,将语音处理对应的运算交由服务端,由服务端对第一语音信号进行美化处理,以得到第二语音信号。可选地,耳机收纳装置中可以设置有显示屏,该显示屏用于对第二语音信号的相关信息进行显示。上述相关信息可以包括如下信息中的至少一种:第二语音信号的波形信号、第二语音信号对应的文本、针对第一语音信号进行了哪些美化处理、以及美化处理后的效果等。可选地,耳机收纳装置中可以设置有例如扬声器的声音播放器件,以对第二语音信号进行播放。可选地,上述终端可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,MovingPictureExpertsGroupAudioLayerIII)播放器、MP4(动态影像专家压缩标准音频层面4,MovingPictureExpertsGroupAudioLayerIV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,应用于耳机装置,所述方法包括:/n采集第一语音信号;/n确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;/n输出所述第二语音信号。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,应用于耳机装置,所述方法包括:
采集第一语音信号;
确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;
输出所述第二语音信号。


2.根据权利要求1所述的方法,其特征在于,所述用户噪音包括:哈气音、咳嗽音、颤音和口音中的至少一种。


3.根据权利要求1或2所述的方法,其特征在于,所述确定所述第一语音信号对应的第二语音信号,包括:
确定用户噪音对应的预设声纹特征;
从所述第一语音信号中滤除与所述预设声纹特征相对应的声音信号,以得到第二语音信号。


4.根据权利要求1或2所述的方法,其特征在于,所述确定所述第一语音信号对应的第二语音信号,包括:
确定所述第一语音信号对应的目标语音类别;
依据目标语音类别对应的第一语音参数,对所述第一语音信号进行处理,得到的第二语音信号对应的第二语音参数与所述第一语音参数相匹配。


5.根据权利要求1或2所述的方法,其特征在于,所述输出所述第二语音信号,包括:
播放所述第二语音信号;和/或
向终端发送所述第二语音信号。


6.根据权利要求1或2所述的方法,其特征在于,所述美化处理还包括:音效处理;
所述音效处理包括如下处理中的至少一种:环绕处理、信道均衡处理、以及混...

【专利技术属性】
技术研发人员:王颖李健涛张丹刘宝张硕杨天府梁宵荣河江李鹏翀
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1