一种语音数据处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:18595248 阅读:31 留言:0更新日期:2018-08-04 20:25
本发明专利技术公开了一种语音数据处理方法,所述方法包括:识别第一语音数据,确定所述第一语音数据的语义;选择与所述语义相适配的声学特征;利用所述声学特征,将所述第一语音数据转换为第二语音数据。本发明专利技术公开了一种语音数据处理装置、电子设备和存储介质。

Speech data processing method, device, electronic device and storage medium

The present invention discloses a method for speech data processing, which includes: identifying first voice data, determining the semantics of the first speech data, selecting the acoustic features adapted to the semantics, and converting the first speech data to second voice data by using the acoustic features. The invention discloses a voice data processing device, an electronic device and a storage medium.

【技术实现步骤摘要】
一种语音数据处理方法、装置、电子设备和存储介质
本专利技术涉及移动终端领域中的信息处理技术,特别涉及一种语音数据处理的方法、装置、电子设备和存储介质。
技术介绍
随着移动通信技术的飞速发展,除了传统的电话通信、短信等功能外,目前又衍生出了许多其他功能。比如,依托于电信语音交互技术的发展而产生的语音交互业务,该语音交互业务利用互动式语音应答(InteractiveVoiceResponse,IVR)系统,为用户实现了各种各样的服务。用户只需要通过手机拨打固定的号码,即可接入服务中心,并根据操作提示语音进行操作以获得用户需要的信息,或者实现语音互动等功能。语音聊天交友是IVR系统所提供的一种常见的功能。用户通过手机拨打指定号码进入IVR系统,通过全程的语音引导,即可进入语音聊天室,并与其他用户进行语音聊天交互。相比于其他社交软件,IVR系统所提供的这种语音聊天方式,操作简单,且全程有语音引导,使得一些文化层次偏低和对新事物接收程度较低的人群也可以轻松快速的上手使用。然而,用户之间只能通过单一的数字身份标识号(Identification,ID)作为认识彼此的标识,极大的影响了用户之间的交流以及自我个性的展示,且用户在语音交流过程中,只能通过系统电子合成音播报的数字号来确定正在跟自己交流的用户,极大的影响了用户使用体验。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例主要提供一种语音数据处理方法、装置、电子设备和存储介质,可以解决用户在使用IVR系统与其他用户进行语音交流过程中,仅能通过数字号进行身份确认的问题。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种语音数据处理方法,所述方法包括:识别第一语音数据,确定所述第一语音数据的语义;选择与所述语义相适配的声学特征;利用所述声学特征,将所述第一语音数据转换为第二语音数据。上述方案中,所述方法还包括:根据预存的声学特征建立声学特征库,其中,所述声学特征库中的声学特征具有特征标签,所述特征标签用于选择与所述第一语音数据的语义相适配的特征标签。上述方案中,其特征在于,所述选择与所述语义相适配的声学特征,包括:将所述第一语音数据转换成文字数据;确定与所述文字数据对应的特征标签;根据确定的特征标签,获取与所述语义相适配的声学特征。上述方案中,所述确定所述文字数据对应的特征标签,包括:提取所述文字数据的关键字;将所述关键字与所述特征标签进行匹配,得到匹配成功的特征标签。上述方案中,所述方法还包括:建立所述第二语音数据与第一账号的对应关系,所述第一账号为与所述第一语音数据对应的用户账号;存储所述第二语音数据以及所述对应关系;当所述第一账号与第二账号建立会话时,将所述第二语音数据发送给所述第二账号的终端。本专利技术实施例还提供了一种语音数据处理装置,所述装置包括:识别模块、处理模块和转换模块;其中,所述识别模块,用于识别第一语音数据,确定所述第一语音数据的语义;所述处理模块,用于选择与所述语义相适配的声学特征;所述转换模块,用于利用所述声学特征,将所述第一语音数据转换为第二语音数据。上述方案中,所述处理模块,还用于根据预存的声学特征建立声学特征库,其中,所述声学特征库中的声学特征具有特征标签,所述特征标签用于选择与所述第一语音数据的语义相适配的特征标签。上述方案中,所述处理模块,具体用于将所述第一语音数据转换成文字数据;确定与所述文字数据对应的特征标签;根据确定的特征标签,获取与所述语义相适配的声学特征。上述方案中,所述处理模块,具体用于提取所述文字数据的关键字;将所述关键字与所述特征标签进行匹配,得到匹配成功的特征标签。上述方案中,所述处理模块,还用于建立所述第二语音数据与第一账号的对应关系,所述第一账号为与所述第一语音数据对应的用户账号;所述装置还包括:存储模块和发送模块;所述存储模块,用于存储所述第二语音数据以及所述对应关系;所述发送模块,用于当所述第一账号与第二账号建立会话时,将所述第二语音数据发送给所述第二账号的终端。本专利技术实施例还提供了一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,所述处理器与所述存储器连接,用于运行所述计算机程序时,执行上述任一项所述方法的步骤。本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。本专利技术实施例所提供的语音数据处理的方法、装置、电子设备和存储介质,可以识别用户输入的第一语音数据,确定所述第一语音数据的语义,进而选择与第一语音数据的语义相适配的声学特征,通过选择的声学特征将所述第一语音数据转换成第二语音数据。由于语音数据的语义会存在差异,进而根据语音数据的语义选择的声学特征也可以不同,从而在利用选择的声学特征转换用户输入的语音数据时,得到的第二语音数据也可以不同,使得转换后的语音数据的声学特征是与语音内容相适配的,从而使得接收方听到的声音特定与语音内容一致,从而丰富了语音转换的效果,提升了用户使用满意度。在一些应用场景下,可以利用第二语音数据标识用户,例如,可以作为用户账号的语音ID。过上述技术方案,一方面可以根据用户输入的第一语音数据,灵活地生成符合用户需要的第二语音数据;另外一方面,由于用户输入的第一语音数据不同,生成的第二语音数据的声音特征也可以各不相同,可以满足用户对语音数据的个性化需求。可以解决现有技术中仅能通过数字号进行身份确认的问题,为用户带来更好的使用体验。附图说明图1为本专利技术实施例中语音数据方法的基本流程示意图;图2为本专利技术实施例中语音数据方法的具体流程示意图;图3为本专利技术实施例中语音数据装置的结构示意图;图4为本专利技术实施例中电子设备的结构示意图。具体实施方式本专利技术实施例提供的语音数据处理方法,可以在用户使用账号首次登陆IVR系统时,通过语音引导的方式,获取用户输入的第一语音数据。然后可以识别所述第一语音数据,确定与用户输入的语音数据所对应的语义,进而可以确定与该语义所对应的声学特征,利用确定的声学特征将所述第一语音数据合成第二语音数据,并可以将第二语音数据作为该用户在IVR系统上的语音ID。通过本专利技术实施例的语音数据处理方式,可以根据用户输入的语音数据,灵活地为用户合成符合用户需要的语音ID。同时,由于用户输入的语音数据不同,合成的第二语音数据的音色或音调也各不相同,从而可以满足用户对ID的个性化需求,为用户带来了更好的使用体验。本专利技术实施例所提供语音数据处理方法的基本流程如图1所示,包括以下步骤:步骤101,识别第一语音数据,确定所述第一语音数据的语义;步骤102,选择与所述语义相适配的声学特征;步骤103,利用所述声学特征,将所述第一语音数据转换为第二语音数据。上述方法可以应用在语音数据处理的装置、设备或者系统中。可选地,所述语音数据处理方法可应用在IVR系统中。所述第一语音数据可以为用户输入的语音数据。例如,当用户使用的账号为首次登录的用户账号时,IVR系统可获取用户输入的第一语音数据。所述第二语音数据可以为经过语音合成以后具有特定人物声音的语音数据,具体如具有孙悟空、猪八戒等人物声音的语音数据。步骤101之前,所述方法还可包括:判断当前用户账号是否为首次登陆的用户账号;若当前用户账号为首本文档来自技高网...

【技术保护点】
1.一种语音数据处理方法,其特征在于,所述方法包括:识别第一语音数据,确定所述第一语音数据的语义;选择与所述语义相适配的声学特征;利用所述声学特征,将所述第一语音数据转换为第二语音数据。

【技术特征摘要】
1.一种语音数据处理方法,其特征在于,所述方法包括:识别第一语音数据,确定所述第一语音数据的语义;选择与所述语义相适配的声学特征;利用所述声学特征,将所述第一语音数据转换为第二语音数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据预存的声学特征建立声学特征库,其中,所述声学特征库中的声学特征具有特征标签,所述特征标签用于选择与所述第一语音数据的语义相适配的特征标签。3.根据权利要求2所述的方法,其特征在于,所述选择与所述语义相适配的声学特征,包括:将所述第一语音数据转换成文字数据;确定与所述文字数据对应的特征标签;根据确定的特征标签,获取与所述语义相适配的声学特征。4.根据权利要求3所述的方法,其特征在于,所述确定所述文字数据对应的特征标签,包括:提取所述文字数据的关键字;将所述关键字与所述特征标签进行匹配,得到匹配成功的特征标签。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:建立所述第二语音数据与第一账号的对应关系,所述第一账号为与所述第一语音数据对应的用户账号;存储所述第二语音数据以及所述对应关系;当所述第一账号与第二账号建立会话时,将所述第二语音数据发送给所述第二账号的终端。6.一种语音数据处理装置,其特征在于,所述装置包括:识别模块、处理模块和转换模块;其中,所述识别模块,用于识别第一语音数据,确定所述第一语音数据的语义;所述处理模块,用于选择与所述语义相适配的声学特征;所述转换模块,用...

【专利技术属性】
技术研发人员:潘杨廖宇袁敏肖巍刘佳佳
申请(专利权)人:咪咕音乐有限公司中国移动通信集团有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1