语音处理方法、装置以及用于语音处理的装置制造方法及图纸

技术编号:17163375 阅读:23 留言:0更新日期:2018-02-01 21:18
本发明专利技术提供了语音处理方法、装置以及用于语音处理的装置,其中一种语音处理方法包括:响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据;响应于对所述文本数据的编辑,获取编辑后的文本数据;将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。采用本发明专利技术实施例,基于文本数据进行修改更方便有些不方便输入语音的应用环境,可以满足用户在聊天时的语音发送需求和对语音的编辑需求,提升用户体验。

Speech processing methods, devices, and devices for speech processing

The invention provides a voice processing method, device and apparatus for processing of speech, including a speech processing method: in response to the selected initial voice data, the initial voice data text data corresponding to the speech recognition; in response to the text data editing, data acquiring text edited speech; the data fragments of text data after editing the corresponding synthesis for voice data. In the embodiment of the invention, modification based on text data is more convenient, and some inconvenient to input the application environment of speech, which can satisfy users' voice transmission needs and voice editing requirements during chatting, and enhance user experience.

【技术实现步骤摘要】
语音处理方法、装置以及用于语音处理的装置
本专利技术涉及输入法
,特别涉及语音处理方法、装置,用于语音处理的装置,以及计算机可读介质。
技术介绍
随着互联网技术的飞速发展,用户使用智能终端进行信息交互的方式越来越普通,越来越多的用户使用聊天软件的语音聊天功能。在用户进行语音聊天的时候,用户可以通过触发聊天软件的语音发送按钮来对自己的语音进行语音,并在松开语音发送按钮的时候,聊天软件会将语音自动发送给其他用户。
技术实现思路
但是专利技术人在研究过程中发现,现有的聊天软件对用户的语音都是自动发送的,即用户松开对语音发送按钮的触摸后,用户说话的语音就会自动发送出去,虽然在用户说错的情况下,用户也可以将2分钟之内的语音进行撤回,但是用户却无法对自己的语音进行编辑。此外,用户在接收到其他用户发送的语音后,如果自己所处的环境比较安静或者不能发出声音例如开会或者听讲座等,那么用户就无法发送相同或者类似内容的、自己的语音。基于此,本专利技术提供了一种语音处理方案,用于对用户需要发送的语音或者用户选中的语音进行语音识别,并将识别结果的文本数据展示给用户,供用户对文本数据进行编辑,并通过将用户编辑后的文本数据生成对应的目标语音数据,从而实现用户自己发出声音即可生成用户的语音数据;或者还可以在用户选中其他用户的语音数据的情况下,实现将其他用户的语音数据转化为自己的语音的功能,从而更方便用户在各种不适合发出声音的应用场景下发生语音,不仅提高用户的聊天效率,也进一步提升用户的聊天体验。本专利技术还提供了一种语音处理装置,用以保证上述方法在实际中的实现及应用。本专利技术实施例提供了一种语音处理方法,该方法包括:响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据;响应于对所述文本数据的编辑,获取编辑后的文本数据;将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。其中,所述响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据,包括:响应于选中初始语音数据,将所述初始语音数据识别为完整文本数据;对所述完整文本数据进行分词得到分词文本数据。其中,所述将编辑后的文本数据对应的语音片段数据合成为目标语音数据,包括:从预设的语音库中获取所述编辑后的分词文本数据对应的语音片段数据;所述语音库用于保存分词文本数据、语音片段数据以及两者的对应关系;按照所述编辑后的分词文本数据的显示顺序,将获取的语音片段数据合成为目标语音数据。其中,所述初始语音数据为第一用户的语音,所述目标语音数据为第二用户的语音;则所述从预设的语音库中获取所述编辑后的分词文本数据对应的语音片段数据,包括:从预设的语音库中查找所述编辑后的分词文本数据对应的、第二用户的语音片段数据;相应的,所述将编辑后的文本数据对应的语音片段数据合成为目标语音数据,包括:按照所述编辑后的分词文本数据的显示顺序,将所述查找的、第二用户的语音数据合成为目标语音数据。其中,所述方法还包括:对于各编辑后的分词文本数据,判断是否查找到对应的第二用户的语音数据,如果全部能查找到,则执行按照所述编辑后的分词结果数据的先后顺序,将所述查找的、第二用户的语音数据合成为目标语音数据;如果不能全部查找到,则将该编辑后的分词文本数据对应的第一用户的语音片段数据,和,查找到的第二用户的语音片段数据,按照编辑后的分词文本数据的显示顺序,合成为目标语音数据。其中,所述初始语音数据和所述目标语音数据为第一用户的语音;则所述从预设的语音库中获取所述编辑后的分词文本数据对应的语音片段数据,包括:从预设的语音库中查找所述编辑后的分词文本数据对应的、第一用户的语音片段数据;相应的,所述将编辑后的文本数据对应的语音片段数据合成为目标语音数据,包括:按照所述编辑后的分词文本数据的显示顺序,将所述查找的、第一用户的语音片段数据合成为目标语音数据。其中,所述编辑包括:删除、增加、修改和/或替换。其中,所述方法还可以包括:将所述目标语音数据发送至接收方。本专利技术实施例还提供了一种语音处理方法,该方法包括:接收待处理的原始语音数据;响应于针对所述原始语音数据的补充文本数据的触发,查找所述补充文本数据对应的补充语音数据;将所述原始语音数据和补充语音数据合成为目标语音数据。其中,所述响应于针对所述原始语音数据的补充文本数据的触发,查找所述补充文本数据对应的补充语音数据,包括:响应于针对所述原始语音数据的补充文本数据的触发,获取所述补充文本数据;对所述补充文本数据进行分词得到分词文本数据;从预设的语音库中分别查找所述分词文本数据对应的语音片段数据,所述语音库用于保存分词文本数据、语音片段数据以及两者的对应关系。其中,所述将所述原始语音数据和补充语音数据合成为目标语音数据,包括:按照所述分词文本数据的显示顺序,将查找到的语音片段数据进行合成得到补充语音数据;根据所述原始语音数据和补充语音数据的语义关系,将所述原始语音数据和所述补充语音数据合成为目标语音数据。本专利技术实施例还提供了一种语音处理装置,该装置包括:语音识别单元,用于响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据;获取单元,用于响应于对所述文本数据的编辑,获取编辑后的文本数据;合成单元,用于将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。其中,所述语音识别单元包括:识别子单元,用于响应于选中初始语音数据,将所述初始语音数据识别为完整文本数据;以及,分词子单元,用于对所述完整文本数据进行分词得到分词文本数据。其中,所述合成单元包括:获取子单元,用于从预设的语音库中获取所述编辑后的分词文本数据对应的语音片段数据;所述语音库用于保存分词文本数据与语音数据的对应关系;以及,合成子单元,用于按照所述编辑后的分词文本数据的显示顺序,将获取的语音片段数据合成为目标语音数据。其中,所述初始语音数据为第一用户的语音,所述目标语音数据为第二用户的语音;则所述获取单元用于:从预设的语音库中查找所述编辑后的分词文本数据对应的、第二用户的语音片段数据;相应的,所述合成单元503可以用于:按照所述编辑后的分词文本数据的显示顺序,将所述查找的、第二用户的语音数据合成为目标语音数据。其中,所述合成单元还包括:判断子单元,用于对于各编辑后的分词文本数据,判断是否查找到对应的第二用户的语音数据;第一处理子单元,用于如果全部能查找到,则执行按照所述编辑后的分词结果数据的先后顺序,将所述查找的、第二用户的语音数据合成为目标语音数据;以及,第二处理子单元,用于如果不能全部查找到,则将该编辑后的分词文本数据对应的第一用户的语音片段数据,和,查找到的第二用户的语音片段数据,按照编辑后的分词文本数据的显示顺序,合成为目标语音数据。其中,所述初始语音数据和所述目标语音数据为第一用户的语音;则所述查找单元用于:从预设的语音库中查找所述编辑后的分词文本数据对应的、第一用户的语音片段数据;相应的,所述合成单元用于:按照所述编辑后的分词文本数据的显示顺序,将所述查找的、第一用户的语音片段数据合成为目标语音数据。其中,所述编辑操作可以包括:删除、增加、修改和/或替换操作。其中,所述语音处理装置还包括:发送单元,用于将所述目标语音数据发送至接收方。本专利技术实施例还提供了一种语音处本文档来自技高网...
语音处理方法、装置以及用于语音处理的装置

【技术保护点】
一种语音处理方法,其特征在于,该方法包括:响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据;响应于对所述文本数据的编辑,获取编辑后的文本数据;将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。

【技术特征摘要】
1.一种语音处理方法,其特征在于,该方法包括:响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据;响应于对所述文本数据的编辑,获取编辑后的文本数据;将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。2.根据权利要求1所述的方法,其特征在于,所述响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据,包括:响应于选中初始语音数据,将所述初始语音数据识别为完整文本数据;对所述完整文本数据进行分词得到分词文本数据。3.根据权利要求2所述的方法,其特征在于,所述将编辑后的文本数据对应的语音片段数据合成为目标语音数据,包括:从预设的语音库中获取所述编辑后的分词文本数据对应的语音片段数据;所述语音库用于保存分词文本数据、语音片段数据以及两者的对应关系;按照所述编辑后的分词文本数据的显示顺序,将获取的语音片段数据合成为目标语音数据。4.一种语音处理方法,其特征在于,该方法包括:接收待处理的原始语音数据;响应于针对所述原始语音数据的补充文本数据的触发,查找所述补充文本数据对应的补充语音数据;将所述原始语音数据和补充语音数据合成为目标语音数据。5.一种语音处理装置,其特征在于,该装置包括:语音识别单元,用于响应于选中初始语音数据,对所述初始语音数据进行语音识别得到对应的文本数据;获取单元,用于响应于对所述文本数据的编辑,获取编辑后的文本数据;合成单元,用于将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。6...

【专利技术属性】
技术研发人员:陈小帅张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1