一种语音模拟方法和装置制造方法及图纸

技术编号:16081435 阅读:26 留言:0更新日期:2017-08-25 16:16
本发明专利技术提供了一种语音模拟方法和装置,其中方法包括如下步骤:获取用户的音频数据;对所述音频数据进行解析,提取所述音频数据的特征信息并保存;根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据;将所述模拟音频数据进行播放。本发明专利技术通过算法对人声进行解析进而提取出特征数据,再使用与用户相同的音素及语调来和用户进行交互或朗读,声音模拟效果好,相似度高、语音音调相似,提高了人机互动的亲切感,避免了现有的语音模拟方法,只能做到普通变声,声音无法变化,相似性低,无法提高人机互动时的适应性和亲切感的问题。

【技术实现步骤摘要】
一种语音模拟方法和装置
本专利技术涉及声音信号
,尤其涉及一种语音模拟方法和装置。
技术介绍
语音,即语言的物质外壳,是语言符号系统的载体。它由人的发音器官发出,负载着一定的语言意义。语音的物理基础主要有音高、音强、音长、音色,这也是构成语音的四要素。语音即语言的声音,是语言符号系统的载体。它由人的发音器官发出,负载着一定的语言意义。语言依靠语音实现它的社会功能。语言是音义结合的符号系统,语言的声音和语言的意义是紧密联系着的,因此,语言虽是一种声音,但又与一般的声音有着本质的区别。语音是人类发音器官发出的具有区别意义功能的声音,不能把语音看成纯粹的自然物质;语音是最直接地记录思维活动的符号体系,是语言交际工具的声音形式。语音的物理基础主要有音高、音强、音长、音色,这也是构成语音的四要素。音高指声波频率,即每秒钟振动次数的多少;音强指声波振幅的大小;音长指声波振动持续时间的长短,也称为"时长";音色指声音的特色和本质,也称作"音质"。人的发音器官及其活动情况是语音的生理基础。人的发音器官分3部分:(1)呼吸器官,包括肺、气管和支气管。肺是呼吸器官的中心,是产生语音动力的基础。(2)喉头和声带,它们是发音的振颤体。(3)口腔、咽腔、鼻腔,它们都是发音的共鸣器。语音和语义的联系是人们在长期的语言实践中约定的,这种音义的结合关系体现了语音有重要的社会属性。语音模拟在人机交互过程中,提升了一定的亲切感和适应性,但现有的人语音模拟方法,均为普通变声装置,只能做到根据人声识别后进行声道模型进行模拟,或只能调节语速和语调,音色无法与被模拟人的声音相提并论。总之,现有的语音模拟方法,只能做到普通变声,声音无法变化,相似性低,无法提高人机互动时的适应性和亲切感。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种语音模拟方法和装置,旨在于解决现有的语音模拟方法,只能做到普通变声,声音无法变化,相似性低,无法提高人机互动时的适应性和亲切感的问题。为解决上述问题,本专利技术提供一种语音模拟方法,包括如下步骤:获取用户的音频数据;对所述音频数据进行解析,提取所述音频数据的特征信息并保存;根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据;将所述模拟音频数据进行播放。优选地,所述获取用户的音频数据之前,还包括:获取所述用户的语音模拟请求信息;根据所述语音模拟请求信息设定与所述用户相对应的用户标识,以及与所述用户标识相对应的用于存储用户音频数据的存储空间;提示用户开始采集所述音频数据。优选地,所述对所述音频数据进行解析,提取所述音频数据的特征信息,包括:在获取所述音频数据后,将所述音频数据的每一帧进行解析;提取出与所述音频数据相对应的音素特征值作为特征信息。优选地,所述获取所述用户的语音模拟请求信息之后,还包括:判断所述用户的语音模拟请求信息是否具有与所述用户相对应的用户标识;若是,调出与所述用户标识相对应的所述模拟音频数据,并进行播放;若否,进行所述根据所述语音模拟请求信息设定与所述用户相对应的用户标识,以及与所述用户标识相对应的用于存储用户音频数据的存储空间的步骤。优选地,所述根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据,包括:调取所述用户请求播放的预设音频数据;根据已保存的所述特征信息将所述预设音频数据转换为与所述音频数据相对应的所述模拟音频数据。此外,为解决上述问题,本专利技术还提供一种语音模拟装置,包括:获取模块、提取模块、生成模块和播放模块;所述获取模块,用于获取用户的音频数据;所述提取模块,用于对所述音频数据进行解析,提取所述音频数据的特征信息并保存;所述生成模块,用于根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据;所述播放模块,用于将所述模拟音频数据进行播放。优选地,还包括:设定模块和提示模块;所述获取模块,还用于获取所述用户的语音模拟请求信息;所述设定模块,用于根据所述语音模拟请求信息设定与所述用户相对应的用户标识,以及与所述用户标识相对应的用于存储用户音频数据的存储空间;所述提示模块,用于提示用户开始采集所述音频数据。优选地,还包括:解析模块;所述解析模块,用于在获取所述音频数据后,将所述音频数据的每一帧进行解析;所述提取模块,还用于提取出与所述音频数据相对应的音素特征值作为特征信息。优选地,还包括:判断模块;所述判断模块,用于判断所述用户的语音模拟请求信息是否具有与所述用户相对应的用户标识;所述播放模块,还用于若是,调出与所述用户标识相对应的所述模拟音频数据,并进行播放;所述设定模块,还用于若否,进行所述根据所述语音模拟请求信息设定与所述用户相对应的用户标识,以及与所述用户标识相对应的用于存储用户音频数据的存储空间的步骤。优选地,包括:调取模块和转换模块;所述调取模块,用于调取所述用户请求播放的预设音频数据;所述转换模块,用于根据已保存的所述特征信息将所述预设音频数据转换为与所述音频数据相对应的所述模拟音频数据。本专利技术提供一种语音模拟方法和装置,其中方法通过对获取的用户音频数据进行解析并提取特征信息,再通过特征信息生成所述音频数据相对应的模拟音频数据,从而对模拟音频数据进行播放。本专利技术通过算法对人声进行解析进而提取出特征数据,再使用与用户相同的音素及语调来和用户进行交互或朗读,声音模拟效果好,相似度高、语音音调相似,提高了人机互动的亲切感,避免了现有的语音模拟方法,只能做到普通变声,声音无法变化,相似性低,无法提高人机互动时的适应性和亲切感的问题。附图说明图1为本专利技术语音模拟方法的一实施例的流程示意图;图2为本专利技术语音模拟方法的二实施例的流程示意图;图3为本专利技术语音模拟方法的三实施例的流程示意图;图4为本专利技术语音模拟方法的四实施例的流程示意图;图5为本专利技术语音模拟方法的五实施例的流程示意图;图6为本专利技术语音模拟装置的实施例的功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种语音模拟方法。参照图1,图1为本专利技术语音模拟方法的一实施例的流程示意图。在一实施例中,所述语音模拟方法包括:步骤S10,获取用户的音频数据;需要理解的是,语音,即语言的物质外壳,是语言符号系统的载体。它由人的发音器官发出,负载着一定的语言意义。语音的物理基础主要有音高、音强、音长、音色,这也是构成语音的四要素。语音即语言的声音,是语言符号系统的载体。它由人的发音器官发出,负载着一定的语言意义。语言依靠语音实现它的社会功能。语言是音义结合的符号系统,语言的声音和语言的意义是紧密联系着的,因此,语言虽是一种声音,但又与一般的声音有着本质的区别。语音是人类发音器官发出的具有区别意义功能的声音,不能把语音看成纯粹的自然物质;语音是最直接地记录思维活动的符号体系,是语言交际工具的声音形式。语音的物理基础主要有音高、音强、音长、音色,这也是构成语音的四要素。音高指声波频率,即每秒钟振动次数的多少;音强指声波振幅的大小;音长指声波振动持续时间的长短,也称为"时长";音色指声音的特色和本质,也称作"音质"。人的发音本文档来自技高网
...
一种语音模拟方法和装置

【技术保护点】
一种语音模拟方法,其特征在于,包括如下步骤:获取用户的音频数据;对所述音频数据进行解析,提取所述音频数据的特征信息并保存;根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据;将所述模拟音频数据进行播放。

【技术特征摘要】
1.一种语音模拟方法,其特征在于,包括如下步骤:获取用户的音频数据;对所述音频数据进行解析,提取所述音频数据的特征信息并保存;根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据;将所述模拟音频数据进行播放。2.如权利要求1所述语音模拟方法,其特征在于,所述获取用户的音频数据之前,还包括:获取所述用户的语音模拟请求信息;根据所述语音模拟请求信息设定与所述用户相对应的用户标识,以及与所述用户标识相对应的用于存储用户音频数据的存储空间;提示用户开始采集所述音频数据。3.如权利要求1或2所述语音模拟方法,其特征在于,所述对所述音频数据进行解析,提取所述音频数据的特征信息,包括:在获取所述音频数据后,将所述音频数据的每一帧进行解析;提取出与所述音频数据相对应的音素特征值作为特征信息。4.如权利要求2所述语音模拟方法,其特征在于,所述获取所述用户的语音模拟请求信息之后,还包括:判断所述用户的语音模拟请求信息是否具有与所述用户相对应的用户标识;若是,调出与所述用户标识相对应的所述模拟音频数据,并进行播放;若否,进行所述根据所述语音模拟请求信息设定与所述用户相对应的用户标识,以及与所述用户标识相对应的用于存储用户音频数据的存储空间的步骤。5.如权利要求1所述语音模拟方法,其特征在于,所述根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据,包括:调取所述用户请求播放的预设音频数据;根据已保存的所述特征信息将所述预设音频数据转换为与所述音频数据相对应的所述模拟音频数据。6.一种语音模拟装置,其特征在于,包括:获取模块、提取模块、生成模块和播放模块;...

【专利技术属性】
技术研发人员:王斌
申请(专利权)人:深圳易方数码科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1