一种模拟发声方法、装置、电子设备及存储介质制造方法及图纸

技术编号：21143707 阅读：25 留言：0更新日期：2019-05-18 05:55

本发明专利技术实施例公开了一种模拟发声的方法、装置、电子设备及存储介质，属于语言识别、语音合成技术，模拟发声方法包括：获取外部输入的信息，并进行信息类型识别；在识别到所述外部输入的信息为音源的情形下，获取并保存所述音源对应的地区语音；在识别到所述外部输入的信息为声音属性的情形下，获取并保存所述声音属性对应的声音元素；在识别到所述外部输入的信息为文本的情形下，识别文本中的文字，根据所述地区语音和所述声音元素对所述文字进行模拟发声。本方法能有针对性的服务用户，使得模拟发声的语言更为丰富、多元化，用户在打字过程中，可以学习不认识文字的读音，以及对于文字读音错误的纠正。进而提高人们学习文字的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种模拟发声方法、装置、电子设备及存储介质
本专利技术实施例涉及语音合成
，具体涉及一种模拟发声的方法、装置、电子设备及存储介质。
技术介绍
随着计算机技术的飞速发展，以及语音识别技术的日渐成熟，语音合成作为通过机械的、电子的方法产生人造语音的技术，也得到了巨大的发展和进步。语音合成，又称文语转换技术，能将任意文字信息实时转化为标准流畅的语音朗读出来，相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术，是中文信息处理领域的一项前沿技术，解决的主要问题就是如何将文字信息转化为可听的声音信息，也即让机器像人一样开口说话，通过计算机语音合成，可以在任何时候将任意文本转换成具有高自然度的语音。语音合成技术得以广泛应用到人们的日常生活中，出现了很多例如有声小说、有声新闻、天气播报以及字典朗读等的语音合成并模拟发声的应用，给人们的日常生活带来了很多便利和娱乐乐趣。本专利技术人发现，现有的语音合成技术中，通常是根据特定人或者特定主题进行语音合成，对文字进行语音翻译，以语音播放文字内容的方式体现，通用性较为有限。
技术实现思路
为此，本专利技术实施例提供一种模拟发声的方法、装置、电子设备及存储介质，以解决现有技术中导致的问题。为了实现上述目的，本专利技术实施例提供如下技术方案：在本专利技术的第一方面，提供一种模拟发声方法，包括：获取外部输入的信息，并进行信息类型识别；在识别到所述外部输入的信息为音源的情形下，获取并保存所述音源对应的地区语音；在识别到所述外部输入的信息为声音属性的情形下，获取并保存所述声音属性对应的声音元素；在识别到所...

【技术保护点】
1.一种模拟发声方法，其特征在于，包括：获取外部输入的信息，并进行信息类型识别；在识别到所述外部输入的信息为音源的情形下，获取并保存所述音源对应的地区语音；在识别到所述外部输入的信息为声音属性的情形下，获取并保存所述声音属性对应的声音元素；在识别到所述外部输入的信息为文本的情形下，识别文本中的文字，根据所述地区语音和所述声音元素对所述文字进行模拟发声。

【技术特征摘要】
1.一种模拟发声方法，其特征在于，包括：获取外部输入的信息，并进行信息类型识别；在识别到所述外部输入的信息为音源的情形下，获取并保存所述音源对应的地区语音；在识别到所述外部输入的信息为声音属性的情形下，获取并保存所述声音属性对应的声音元素；在识别到所述外部输入的信息为文本的情形下，识别文本中的文字，根据所述地区语音和所述声音元素对所述文字进行模拟发声。2.如权利要求1所述的方法，其特征在于，所述在识别到所述外部输入的信息为文本的情形下，识别文本中的文字，还包括：在微调模式下，获取被选中的文字，对所述被选中的文字对应的语音进行微调。3.如权利要求1所述的方法，其特征在于，所述在识别到所述外部输入的信息为音源的情形下，获取并保存所述音源对应的地区语音，包括：获取所述音源对应的国家及地区，根据所述国家及地区获取地区语音。4.如权利要求1所述的方法，其特征在于，所述方法还包括：在识别到所述外部输入的信息为释义的情形下，从所述外部输入的信息中获取待解释文本，获取并提示所述待解释文本对应的解释内容。5.一种输入文字模拟发声的方法，其特征在于，包括：获取外部输入的信息，并进行信息类型识别；在识别到所述外部输入的信息为输入法的情形下，获取并保存输入法设置信息对应的输入法；在识别到所述外部输入的信息为音源的情形下，获取并保存所述音源对应的地区语音；在识别到所述外部输入的信息为声音属性的情形下，获取并保存所述声音属性对应的声音元素；在识别到所述外部输入的信息为文本的情形下，根据所述地区语音和所述声音元素对所述文本中的文字进行模拟发声；所述方法还包括：根据所述输入法以及所述地区语音和所述声音元素，在动态输出文字文本的过程中，对相应文本中的文字进行模拟发声。6.一种模拟发声装置，其特征在于，包括：信息获取模块，用于获取外部输入的信息，并进行信息类型识别；音源设置模块，用于在识别到所述外部输入的信息为音源的情形下，获取并保存所述音源对应的地区语音；声音属性设置模块，用于在识别到所述外部输入的信息为声音属性的情形下，获取并保存所述声音属性对应的声音元素；语音合成模块，用于在识别到所述外部输入的信息为文字的情形下，识别文字内容，根据所述地区语...

【专利技术属性】
技术研发人员：谷晓佳，
申请(专利权)人：谷晓佳，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人