本发明专利技术实施例提供了一种基音混合方法及装置,应用于人工智能系统,所述方法包括:当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;接收用户输入的用户音频数据;将所述环境音频数据拆分成拆分音频数据;合并所述用户音频数据与所述多路拆分音频数据,生成混合音频数据。本实施例提出的方法操作简便,可以从语音数据中提取出各个语言特征以及不同的语音数据,并利用不同的语音数据或语音特征和预设的语音数据进行混合,可以实现人工智能系统的基音混合,同时在混合过程中的计算量小,也降低了系统功耗,而且可以采用混合音频数据进行语音训练,也提高了人工智能系统识别的准确度,可以准确识别用户的指令。
A method and device of pitch mixing
【技术实现步骤摘要】
一种基音混合方法及装置
本专利技术涉及互联网
,特别是涉及一种基音混合方法以及一种基音混合装置。
技术介绍
随着互联网的不断普及,人工智能系统也逐渐进入人们的生活一部分,为人们生活提供便利。人工智能系统可以通过识别用户的语音数据,从而执行语音数据对应的操作,为用户的生活提供便利。目前的人工智能系统都是在获取语音数据后,执行对应的操作。为了可以提高识别识别的准确率,普遍采用人工录制以及人工标注的方式,得到用于训练深度神经元网络的语音数据。而常用的方法只能标注人声或单一声音,混音方法单一,范围窄,只能按照单一声音进行混合利用,大大限制了人工智能系统的工作。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种基音混合方法以及一种基音混合装置。为了解决上述问题,本专利技术实施例公开了一种基音混合方法,所述方法应用于人工智能系统,所述方法包括;当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;接收用户输入的用户音频数据;将所述环境音频数据拆分成拆分音频数据;合并所述用户音频数据与所述多路拆分音频数据,生成混合音频数据。可选地,所述拆分音频数据包括人声数据、噪声数据,所述将所述环境音频数据拆分成拆分音频数据,包括:采用预设的声音检测模型识别所述环境音频数据的音频波形;计算所述音频波的幅值是否大于预设值;若所述音频波形的幅值大于预设值,则将所述环境音频数据拆分成人声数据和噪声数据。可选地,所述合并所述用户音频数据与所述多路拆分音频数据,包括:获取所述用户音频数据的用户波形,与所述人声数据的人声波形;判断所述用户波形与所述人声波形是否相同;若所述用户波形与所述人声波形相同,则合并所述用户音频数据与所述环境音频数据,生成混合音频数据;若所述用户波形与所述人声波形不相同,则将所述用户音频数据、所述人声数据以及所述噪声数据依次合并,生成混合音频数据。可选地,所述方法还包括:若所述音频波形的幅值小于预设值,则分别从所述用户音频数据中提取用户语音特征,和从所述环境音频数据中提取环境音频特征;合并所述用户语音特征和所述环境音频特征,生成训练语音特征;采用所述训练语音特征进行语音训练。本专利技术实施例还公开了一种基音混合装置,应用于人工智能系统,所述装置包括:获取模块,用于当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;接收模块,用于接收用户输入的用户音频数据;拆分模块,用于将所述环境音频数据拆分成拆分音频数据;合并模块,用于合并所述用户音频数据与所述多路拆分音频数据,生成混合音频数据。可选地,所述拆分音频数据包括人声数据、噪声数据,所述拆分模块,包括:采用模块,用于采用预设的声音检测模型识别所述环境音频数据的音频波形;计算模块,用于计算所述音频波的幅值是否大于预设值;拆分数据模块,用于若所述音频波形的幅值大于预设值,则将所述环境音频数据拆分成人声数据和噪声数据。可选地,所述合并模块,包括:获取波形模块,用于获取所述用户音频数据的用户波形,与所述人声数据的人声波形;判断波形模块,用于判断所述用户波形与所述人声波形是否相同;波形相同模块,用于若所述用户波形与所述人声波形相同,则合并所述用户音频数据与所述环境音频数据,生成混合音频数据;波形不相同模块,用于若所述用户波形与所述人声波形不相同,则将所述用户音频数据、所述人声数据以及所述噪声数据依次合并,生成混合音频数据。可选地,所述装置还包括:提取模块,用于若所述音频波形的幅值小于预设值,则分别从所述用户音频数据中提取用户语音特征,和从所述环境音频数据中提取环境音频特征;生成模块,用于合并所述用户语音特征和所述环境音频特征,生成训练语音特征;训练模块,用于采用所述训练语音特征进行语音训练。本专利技术实施例还公开了一种装置,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如上述实施例所述的一个或多个方法。本专利技术实施例还公开了一种计算机可读存储介质,其存储的计算机程序使得处理器执行如上述实施例所述的任一项所述方法。本专利技术实施例包括以下优点:本实施例提出了一种基音混合方法,该方法可以当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;接收用户输入的用户音频数据;将所述环境音频数据拆分成拆分音频数据;合并所述用户音频数据与所述多路拆分音频数据,生成混合音频数据。本实施例提出的基音混合方法,操作简便,可以从语音数据中提取出各个语言特征以及不同的语音数据,并利用不同的语音数据或语音特征和预设的语音数据进行混合,可以实现人工智能系统的基音混合,同时在混合过程中的计算量小,也降低了系统功耗,而且该人工智能系统可以采用混合音频数据进行语音训练,也提高了人工智能系统识别的准确度,可以准确识别用户的指令,提高用户的使用体验。附图说明图1是本专利技术的基音混合方法实施例一的步骤流程图;图2是本专利技术的基音混合方法实施例二的步骤流程图;图3是本专利技术的基音混合装置实施例一的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参照图1,示出了本专利技术的基音混合方法实施例一的步骤流程图,在本实施例中,该方法可以应用于人工智能系统,该人工智能系统可以是利用人工智能技术或知识工程技术而开发的应用系统、或者基于知识的软件工程辅助系统、或者通过集成操作系统和人工智能与认知科学而进行研究的智能操作系统,又或者是移动终端、计算机终端或者类似的运算装置等等。在具体实现中,该人工智能系统可以是语音智能系统。该语音智能系统可以包括用于接收语音数据的语音接收设备、识别语音数据的识别设备、红外传感器、热源探测器、一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)以及用于存储数据的存储器。其中,存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本专利技术实施例中的报文接收方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。在本实施例中,该方法可以包括:步骤101,当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据。在本实本文档来自技高网...
【技术保护点】
1.一种基音混合方法,其特征在于,应用于人工智能系统,所述方法包括:/n当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;/n接收用户输入的用户音频数据;/n将所述环境音频数据拆分成拆分音频数据;/n合并所述用户音频数据与所述多路拆分音频数据,生成混合音频数据。/n
【技术特征摘要】
1.一种基音混合方法,其特征在于,应用于人工智能系统,所述方法包括:
当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;
接收用户输入的用户音频数据;
将所述环境音频数据拆分成拆分音频数据;
合并所述用户音频数据与所述多路拆分音频数据,生成混合音频数据。
2.根据权利要求1所述的方法,其特征在于,所述拆分音频数据包括人声数据、噪声数据,所述将所述环境音频数据拆分成拆分音频数据,包括:
采用预设的声音检测模型识别所述环境音频数据的音频波形;
计算所述音频波的幅值是否大于预设值;
若所述音频波形的幅值大于预设值,则将所述环境音频数据拆分成人声数据和噪声数据。
3.根据权利要求2所述的方法,其特征在于,所述合并所述用户音频数据与所述多路拆分音频数据,包括:
获取所述用户音频数据的用户波形,与所述人声数据的人声波形;
判断所述用户波形与所述人声波形是否相同;
若所述用户波形与所述人声波形相同,则合并所述用户音频数据与所述环境音频数据,生成混合音频数据;
若所述用户波形与所述人声波形不相同,则将所述用户音频数据、所述人声数据以及所述噪声数据依次合并,生成混合音频数据。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述音频波形的幅值小于预设值,则分别从所述用户音频数据中提取用户语音特征,和从所述环境音频数据中提取环境音频特征;
合并所述用户语音特征和所述环境音频特征,生成训练语音特征;
采用所述训练语音特征进行语音训练。
5.一种基音混合装置,其特征在于,应用于人工智能系统,所述装置包括:
获取模块,用于当所述人工智能系统接收唤醒指令时,获取当前的环境音频数据;
接收模块,用于接收用户输入的用户音频数据;
拆分模块,用于将所述环境音频数据拆...
【专利技术属性】
技术研发人员:张尉雄,
申请(专利权)人:深圳市瑞讯云技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。