当前位置: 首页 > 专利查询>谷晓佳专利>正文

一种模拟发声方法、装置、电子设备及存储介质制造方法及图纸

技术编号:21143707 阅读:25 留言:0更新日期:2019-05-18 05:55
本发明专利技术实施例公开了一种模拟发声的方法、装置、电子设备及存储介质,属于语言识别、语音合成技术,模拟发声方法包括:获取外部输入的信息,并进行信息类型识别;在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;在识别到所述外部输入的信息为文本的情形下,识别文本中的文字,根据所述地区语音和所述声音元素对所述文字进行模拟发声。本方法能有针对性的服务用户,使得模拟发声的语言更为丰富、多元化,用户在打字过程中,可以学习不认识文字的读音,以及对于文字读音错误的纠正。进而提高人们学习文字的效率。

【技术实现步骤摘要】
一种模拟发声方法、装置、电子设备及存储介质
本专利技术实施例涉及语音合成
,具体涉及一种模拟发声的方法、装置、电子设备及存储介质。
技术介绍
随着计算机技术的飞速发展,以及语音识别技术的日渐成熟,语音合成作为通过机械的、电子的方法产生人造语音的技术,也得到了巨大的发展和进步。语音合成,又称文语转换技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话,通过计算机语音合成,可以在任何时候将任意文本转换成具有高自然度的语音。语音合成技术得以广泛应用到人们的日常生活中,出现了很多例如有声小说、有声新闻、天气播报以及字典朗读等的语音合成并模拟发声的应用,给人们的日常生活带来了很多便利和娱乐乐趣。本专利技术人发现,现有的语音合成技术中,通常是根据特定人或者特定主题进行语音合成,对文字进行语音翻译,以语音播放文字内容的方式体现,通用性较为有限。
技术实现思路
为此,本专利技术实施例提供一种模拟发声的方法、装置、电子设备及存储介质,以解决现有技术中导致的问题。为了实现上述目的,本专利技术实施例提供如下技术方案:在本专利技术的第一方面,提供一种模拟发声方法,包括:获取外部输入的信息,并进行信息类型识别;在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;在识别到所述外部输入的信息为文本的情形下,识别文本中的文字,根据所述地区语音和所述声音元素对所述文字进行模拟发声。在另一实施例中,所述在识别到所述外部输入的信息为文本的情形下,识别文本中的文字,还包括:在微调模式下,获取被选中的文字,对所述被选中的文字对应的语音进行微调。在另一实施例中,所述获取外部输入的信息,并进行信息类型识别,包括:获取外部输入的信息,从所述外部输入的信息中获取所述外部输入的信息的属性,根据所述外部输入的信息的属性,判断所述外部输入的信息所属的信息类型。在另一实施例中,所述在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音,包括:获取所述音源对应的国家及地区,根据所述国家及地区获取地区语音。在另一实施例中,所述方法还包括:在识别到所述外部输入的信息为释义的情形下,从所述外部输入的信息中获取待解释文本,获取并提示所述待解释文本对应的解释内容。在本专利技术的第二方面,提供一种输入文字模拟发声的方法,包括:获取外部输入的信息,并进行信息类型识别;在识别到所示外部输入的信息为输入法的情形下,获取并保存输入法设置信息对应的输入法;在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;在识别到所述外部输入的信息为文本的情形下,根据所述地区语音和所述声音元素对所述文本中的文字进行模拟发声;所述方法还包括:根据所述输入法以及所述地区语音和所述声音元素,在动态输出文字文本的过程中,对相应文本中的文字进行模拟发声。在本专利技术的第三方面,提供一种模拟发声装置,包括:信息获取模块,用于获取外部输入的信息,并进行信息类型识别;音源设置模块,用于在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;声音属性设置模块,用于在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;语音合成模块,用于在识别到所述外部输入的信息为文字的情形下,识别文字内容,根据所述地区语音和所述声音元素对所述文字进行模拟发声。在本专利技术的第四方面,提供一种输入文字模拟发声的装置,包括:信息收集模块,用于获取外部输入的信息,并进行信息类型识别;输入法配置模块,用于在识别到所示外部输入的信息为输入法的情形下,获取并保存输入法设置信息对应的输入法;音源配置模块,用于在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;声音属性配置模块,用于在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;语音模拟模块,用于在识别到所述外部输入的信息为文本的情形下,根据所述地区语音和所述声音元素对所述文本中的文字进行模拟发声;还用于根据所述输入法以及所述地区语音和所述声音元素,在动态输出文字文本的过程中,对相应文本中的文字进行模拟发声。在本专利技术的第五方面,提供一种模拟发声电子设备,包括:输入器,分别于音频设置器和播放器相连,用于获取外部输入的信息,并进行信息类型识别;音频设置器,用于在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;还用于在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;播放器,用于在识别到所述外部输入的信息为文字的情形下,识别文字内容,根据所述地区语音和所述声音元素对所述文字进行模拟发声。在本专利技术的第六方面,提供一种输入文字模拟发声的电子设备,包括:信息采集器,用于获取外部输入的信息,并进行信息类型识别;配置器,用于在识别到所示外部输入的信息为输入法的情形下,获取并保存输入法设置信息对应的输入法;用于在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;用于在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;合成器,用于在识别到所述外部输入的信息为文本的情形下,根据所述地区语音和所述声音元素对所述文本中的文字进行模拟发声;还用于根据所述输入法以及所述地区语音和所述声音元素,在动态输出文字文本的过程中,对相应文本中的文字进行模拟发声。进一步地,合成器,用于语音输入合成。根据输入法输入文字文本,该文字文本信息作为语言合成的输入信息。在本专利技术的第七方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序用于实现如上所述的模拟发声方法。在本专利技术的第八方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序用于实现如上所述的输入文字模拟发声方法。本专利技术实施例具有如下优点:通过获取外部输入的信息,进行音源设置,进而能够合成对应的地区语言对文字进行模拟发声,有针对性的服务用户,使得模拟发声的语言更为丰富、多元化。另外,采用本专利技术方法,可以在获取到文本的同时,针对文本内容发声,使得用户在在打字过程中,可以学习不认识文字的读音,以及对于文字读音错误的纠正。进而提高人们学习文字的效率。更进一步的,通过将文本文件转化为了声音文件,可以使得信息可以更快、更方便的传播和分享。更进一步地,采用段落、文章语音中对于文字语音的微调,可以营造更亲切、更为容易接受的用户体验。附图说明为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。本说明书所绘示的结构、本文档来自技高网...

【技术保护点】
1.一种模拟发声方法,其特征在于,包括:获取外部输入的信息,并进行信息类型识别;在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;在识别到所述外部输入的信息为文本的情形下,识别文本中的文字,根据所述地区语音和所述声音元素对所述文字进行模拟发声。

【技术特征摘要】
1.一种模拟发声方法,其特征在于,包括:获取外部输入的信息,并进行信息类型识别;在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;在识别到所述外部输入的信息为文本的情形下,识别文本中的文字,根据所述地区语音和所述声音元素对所述文字进行模拟发声。2.如权利要求1所述的方法,其特征在于,所述在识别到所述外部输入的信息为文本的情形下,识别文本中的文字,还包括:在微调模式下,获取被选中的文字,对所述被选中的文字对应的语音进行微调。3.如权利要求1所述的方法,其特征在于,所述在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音,包括:获取所述音源对应的国家及地区,根据所述国家及地区获取地区语音。4.如权利要求1所述的方法,其特征在于,所述方法还包括:在识别到所述外部输入的信息为释义的情形下,从所述外部输入的信息中获取待解释文本,获取并提示所述待解释文本对应的解释内容。5.一种输入文字模拟发声的方法,其特征在于,包括:获取外部输入的信息,并进行信息类型识别;在识别到所述外部输入的信息为输入法的情形下,获取并保存输入法设置信息对应的输入法;在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;在识别到所述外部输入的信息为文本的情形下,根据所述地区语音和所述声音元素对所述文本中的文字进行模拟发声;所述方法还包括:根据所述输入法以及所述地区语音和所述声音元素,在动态输出文字文本的过程中,对相应文本中的文字进行模拟发声。6.一种模拟发声装置,其特征在于,包括:信息获取模块,用于获取外部输入的信息,并进行信息类型识别;音源设置模块,用于在识别到所述外部输入的信息为音源的情形下,获取并保存所述音源对应的地区语音;声音属性设置模块,用于在识别到所述外部输入的信息为声音属性的情形下,获取并保存所述声音属性对应的声音元素;语音合成模块,用于在识别到所述外部输入的信息为文字的情形下,识别文字内容,根据所述地区语...

【专利技术属性】
技术研发人员:谷晓佳
申请(专利权)人:谷晓佳
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1