一种语音编辑方法以及装置制造方法及图纸

技术编号：21303952 阅读：35 留言：0更新日期：2019-06-12 09:08

本申请公开了一种语音编辑方法、装置以及计算机可读存储介质，所述语音编辑方法包括：在语音交互接口中接收针对初始语音数据的编辑触发指令；基于所述编辑触发指令生成对应的语音编辑接口；通过所述语音编辑接口接收编辑指令；根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据；其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。通过本申请所提供的方法，可使所述初始语音数据在发送前首先进行编辑，增加了语音交互过程中的全面性和便利性。

A Speech Editing Method and Device

This application discloses a voice editing method, device and computer readable storage medium. The voice editing method includes: receiving an editing trigger instruction for initial voice data in a voice interactive interface; generating a corresponding voice editing interface based on the editing trigger instruction; receiving an editing instruction through the voice editing interface; and receiving the editing instruction according to the editing instruction. The initial voice data is processed to obtain the target voice data, in which the first interactive object corresponding to the initial voice data interacts with the second interactive object through the voice interaction interface. By the method provided in this application, the initial voice data can be edited first before transmission, which increases the comprehensiveness and convenience of voice interaction.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音编辑方法以及装置
本申请涉及网络通信
，具体涉及一种语音编辑方法。本申请同时涉及一种语音编辑装置，以及一种计算机可读存储介质。
技术介绍
现有的语音处理技术中，语音编辑技术已经越来越多的应用到各种语音播放场景中，例如各种音乐播放器和音频学习软件中，对于语音的剪辑、语音播放效果选择等功能应用日趋成熟。在现有的交互场景中，如应用较为广泛的钉钉、微信等社交软件上均设有语音交互功能，其大大提高了信息交互的便利性和可靠性，现有的语音交互方式一般为输入语音数据后直接进行发送或取消。然而，上述的语音交互方式存在以下不足：在现有的语音交互场景下，对于已输入的语音数据，只可进行发送和删除操作，而无法对输入的语音数据按预定方式进行编辑，如此便造成了用户无法对所述已输入的语音数据进行灵活操作，例如，无法对所述已输入的语音数据进行剪辑、播放效果选择等语音编辑操作，若所述已输入的语音数据的某一部分需作修整，或者预使所述语音数据以预想的播放效果进行播放，则无法实现。上述无法对已输入的语音数据进行编辑使得现有的语音交互过程缺乏科学性和便利性。
技术实现思路
本申请提供一种语音编辑方法...

【技术保护点】
1.一种语音编辑方法，其特征在于，包括：在语音交互接口中接收针对初始语音数据的编辑触发指令；基于所述编辑触发指令生成对应的语音编辑接口；通过所述语音编辑接口接收编辑指令；根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据；其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。

【技术特征摘要】
1.一种语音编辑方法，其特征在于，包括：在语音交互接口中接收针对初始语音数据的编辑触发指令；基于所述编辑触发指令生成对应的语音编辑接口；通过所述语音编辑接口接收编辑指令；根据所述编辑指令对所述初始语音数据进行处理，获得目标语音数据；其中，所述初始语音数据对应的第一交互对象通过所述语音交互接口与第二交互对象进行交互。2.根据权利要求1所述的语音编辑方法，其特征在于，所述语音编辑接口，包括下述至少一项：用于对语音数据进行剪辑的剪辑接口；用于对语音数据的音频特征进行编辑处理的音频特征处理接口。3.根据权利要求2所述的语音编辑方法，其特征在于，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：创建所述剪辑接口对应的剪辑界面；基于所述语音交互接口显示所述剪辑界面；其中，所述剪辑界面设有时间轴和置于所述时间轴上的第一可滑动标识和第二可滑动标识，所述时间轴的长度对应于语音数据的时长，所述时间轴的起始位置对应语音数据的起始时间点、终止位置对应语音数据的终止时间点，所述第一可滑动标识在所述时间轴上的位置对应语音数据的目标起始时间点，所述第二可滑动标识在所述时间轴上的位置对应语音数据的目标终止时间点。4.根据权利要求3所述的语音编辑方法，其特征在于，所述编辑指令，包括：针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令；相应的，根据所述编辑指令对所述初始语音数据进行处理，采用如下方式实现：确定所述第一可滑动标识在所述时间轴上的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴上的位置对应的目标终止时间点；剔除所述初始语音数据在所述目标起始时间点前的语音数据，和/或剔除所述初始语音数据在所述目标终止时间点后的语音数据，将处理后获得的语音数据作为所述目标语音数据。5.根据权利要求2所述的语音编辑方法，其特征在于，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：创建所述音频特征处理接口对应的音频特征处理界面；基于所述语音交互接口显示所述音频特征处理界面；其中，所述音频特征处理界面设有至少一个音频特征标识，所述音频特征标识对应目标频率、目标波长和/或目标振幅的语音数据。6.根据权利要求5所述的语音编辑方法，其特征在于，所述编辑指令，包括：针对所述音频特征处理界面中音频特征标识的点击触控指令；相应的，根据所述编辑指令对所述初始语音数据进行处理，采用如下方式实现：确定所述点击触控指令针对的音频特征标识对应的目标频率、目标波长和/或目标振幅；按照所述目标频率、目标波长和/或目标振幅对所述初始语音数据进行音频特征变更处理，使其频率、波长和/或振幅与所述目标频率、目标波长和/或目标振幅相同，将音频特征变更处理后获得的语音数据作为所述目标语音数据。7.根据权利要求2所述的语音编辑方法，其特征在于，所述基于所述编辑触发指令生成对应的语音编辑接口，采用如下方式实现：创建所述剪辑接口对应的剪辑界面，以及所述音频特征处理接口对应的音频特征处理界面；基于所述语音交互接口显示所述剪辑界面以及所述音频特征处理界面；其中，所述剪辑界面设有时间轴和置于所述时间轴上的第一可滑动标识和第二可滑动标识，所述时间轴的长度对应于语音数据的时长，所述时间轴的起始位置对应语音数据的起始时间点、终止位置对应语音数据的终止时间点，所述第一可滑动标识在所述时间轴上的位置对应语音数据的目标起始时间点，所述第二可滑动标识在所述时间轴上的位置对应语音数据的目标终止时间点；所述音频特征处理界面设有至少一个音频特征标识，所述音频特征标识对应目标频率、目标波长和/或目标振幅的语音数据。8.根据权利要求7所述的语音编辑方法，其特征在于，所述编辑指令，包括：针对所述时间轴上的第一可滑动标识和/或第二可滑动标识输入的滑动触控指令，和/或针对所述音频特征处理界面中音频特征标识的点击触控指令；相应的，根据所述编辑指令对所述初始语音数据进行处理，采用如下方式中的至少一种实现：确定所述第一可滑动标识在所述时间轴的位置对应的目标起始时间点，和/或所述第二可滑动标识在所述时间轴的位置对应的目标终止时间点；剔除所述初始语音数据在所述目标起始时间点前的语音数据，和/或剔除所述初始语音数据在所述目标终止时间点后的语音数据；按照所述目标频率、目标波长和/或目标振幅...

【专利技术属性】
技术研发人员：谭啸，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人