语音处理方法、装置以及用于语音处理的装置制造方法及图纸

技术编号：17163375 阅读：23 留言：0更新日期：2018-02-01 21:18

本发明专利技术提供了语音处理方法、装置以及用于语音处理的装置，其中一种语音处理方法包括：响应于选中初始语音数据，对所述初始语音数据进行语音识别得到对应的文本数据；响应于对所述文本数据的编辑，获取编辑后的文本数据；将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。采用本发明专利技术实施例，基于文本数据进行修改更方便有些不方便输入语音的应用环境，可以满足用户在聊天时的语音发送需求和对语音的编辑需求，提升用户体验。

Speech processing methods, devices, and devices for speech processing

The invention provides a voice processing method, device and apparatus for processing of speech, including a speech processing method: in response to the selected initial voice data, the initial voice data text data corresponding to the speech recognition; in response to the text data editing, data acquiring text edited speech; the data fragments of text data after editing the corresponding synthesis for voice data. In the embodiment of the invention, modification based on text data is more convenient, and some inconvenient to input the application environment of speech, which can satisfy users' voice transmission needs and voice editing requirements during chatting, and enhance user experience.

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置以及用于语音处理的装置
本专利技术涉及输入法
，特别涉及语音处理方法、装置，用于语音处理的装置，以及计算机可读介质。
技术介绍
随着互联网技术的飞速发展，用户使用智能终端进行信息交互的方式越来越普通，越来越多的用户使用聊天软件的语音聊天功能。在用户进行语音聊天的时候，用户可以通过触发聊天软件的语音发送按钮来对自己的语音进行语音，并在松开语音发送按钮的时候，聊天软件会将语音自动发送给其他用户。
技术实现思路
但是专利技术人在研究过程中发现，现有的聊天软件对用户的语音都是自动发送的，即用户松开对语音发送按钮的触摸后，用户说话的语音就会自动发送出去，虽然在用户说错的情况下，用户也可以将2分钟之内的语音进行撤回，但是用户却无法对自己的语音进行编辑。此外，用户在接收到其他用户发送的语音后，如果自己所处的环境比较安静或者不能发出声音例如开会或者听讲座等，那么用户就无法发送相同或者类似内容的、自己的语音。基于此，本专利技术提供了一种语音处理方案，用于对用户需要发送的语音或者用户选中的语音进行语音识别，并将识别结果的文本数据展示给用户，供用户对文本数据进行编辑，并通过将用户编辑后的文本数据生成对应的目标语音数据，从而实现用户自己发出声音即可生成用户的语音数据；或者还可以在用户选中其他用户的语音数据的情况下，实现将其他用户的语音数据转化为自己的语音的功能，从而更方便用户在各种不适合发出声音的应用场景下发生语音，不仅提高用户的聊天效率，也进一步提升用户的聊天体验。本专利技术还提供了一种语音处理装置，用以保证上述方法在实际中的实现及应用。本专利技术实施例提供...
语音处理方法、装置以及用于语音处理的装置

【技术保护点】
一种语音处理方法，其特征在于，该方法包括：响应于选中初始语音数据，对所述初始语音数据进行语音识别得到对应的文本数据；响应于对所述文本数据的编辑，获取编辑后的文本数据；将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。

【技术特征摘要】
1.一种语音处理方法，其特征在于，该方法包括：响应于选中初始语音数据，对所述初始语音数据进行语音识别得到对应的文本数据；响应于对所述文本数据的编辑，获取编辑后的文本数据；将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。2.根据权利要求1所述的方法，其特征在于，所述响应于选中初始语音数据，对所述初始语音数据进行语音识别得到对应的文本数据，包括：响应于选中初始语音数据，将所述初始语音数据识别为完整文本数据；对所述完整文本数据进行分词得到分词文本数据。3.根据权利要求2所述的方法，其特征在于，所述将编辑后的文本数据对应的语音片段数据合成为目标语音数据，包括：从预设的语音库中获取所述编辑后的分词文本数据对应的语音片段数据；所述语音库用于保存分词文本数据、语音片段数据以及两者的对应关系；按照所述编辑后的分词文本数据的显示顺序，将获取的语音片段数据合成为目标语音数据。4.一种语音处理方法，其特征在于，该方法包括：接收待处理的原始语音数据；响应于针对所述原始语音数据的补充文本数据的触发，查找所述补充文本数据对应的补充语音数据；将所述原始语音数据和补充语音数据合成为目标语音数据。5.一种语音处理装置，其特征在于，该装置包括：语音识别单元，用于响应于选中初始语音数据，对所述初始语音数据进行语音识别得到对应的文本数据；获取单元，用于响应于对所述文本数据的编辑，获取编辑后的文本数据；合成单元，用于将所述编辑后的文本数据对应的语音片段数据合成为目标语音数据。6...

【专利技术属性】
技术研发人员：陈小帅，张扬，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人