一种语音模拟方法和装置制造方法及图纸

技术编号：16081435 阅读：26 留言：0更新日期：2017-08-25 16:16

本发明专利技术提供了一种语音模拟方法和装置，其中方法包括如下步骤：获取用户的音频数据；对所述音频数据进行解析，提取所述音频数据的特征信息并保存；根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据；将所述模拟音频数据进行播放。本发明专利技术通过算法对人声进行解析进而提取出特征数据，再使用与用户相同的音素及语调来和用户进行交互或朗读，声音模拟效果好，相似度高、语音音调相似，提高了人机互动的亲切感，避免了现有的语音模拟方法，只能做到普通变声，声音无法变化，相似性低，无法提高人机互动时的适应性和亲切感的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音模拟方法和装置
本专利技术涉及声音信号
，尤其涉及一种语音模拟方法和装置。
技术介绍
语音，即语言的物质外壳，是语言符号系统的载体。它由人的发音器官发出，负载着一定的语言意义。语音的物理基础主要有音高、音强、音长、音色，这也是构成语音的四要素。语音即语言的声音，是语言符号系统的载体。它由人的发音器官发出，负载着一定的语言意义。语言依靠语音实现它的社会功能。语言是音义结合的符号系统，语言的声音和语言的意义是紧密联系着的，因此，语言虽是一种声音，但又与一般的声音有着本质的区别。语音是人类发音器官发出的具有区别意义功能的声音，不能把语音看成纯粹的自然物质；语音是最直接地记录思维活动的符号体系，是语言交际工具的声音形式。语音的物理基础主要有音高、音强、音长、音色，这也是构成语音的四要素。音高指声波频率，即每秒钟振动次数的多少；音强指声波振幅的大小；音长指声波振动持续时间的长短，也称为"时长"；音色指声音的特色和本质，也称作"音质"。人的发音器官及其活动情况是语音的生理基础。人的发音器官分3部分：(1)呼吸器官，包括肺、气管和支气管。肺是呼吸器官的中心，是产生语音动力的基础。(2)喉头和声带，它们是发音的振颤体。(3)口腔、咽腔、鼻腔，它们都是发音的共鸣器。语音和语义的联系是人们在长期的语言实践中约定的，这种音义的结合关系体现了语音有重要的社会属性。语音模拟在人机交互过程中，提升了一定的亲切感和适应性，但现有的人语音模拟方法，均为普通变声装置，只能做到根据人声识别后进行声道模型进行模拟，或只能调节语速和语调，音色无法与被模拟人的声音相提并论。总之，现有...
一种语音模拟方法和装置

【技术保护点】
一种语音模拟方法，其特征在于，包括如下步骤：获取用户的音频数据；对所述音频数据进行解析，提取所述音频数据的特征信息并保存；根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据；将所述模拟音频数据进行播放。

【技术特征摘要】
1.一种语音模拟方法，其特征在于，包括如下步骤：获取用户的音频数据；对所述音频数据进行解析，提取所述音频数据的特征信息并保存；根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据；将所述模拟音频数据进行播放。2.如权利要求1所述语音模拟方法，其特征在于，所述获取用户的音频数据之前，还包括：获取所述用户的语音模拟请求信息；根据所述语音模拟请求信息设定与所述用户相对应的用户标识，以及与所述用户标识相对应的用于存储用户音频数据的存储空间；提示用户开始采集所述音频数据。3.如权利要求1或2所述语音模拟方法，其特征在于，所述对所述音频数据进行解析，提取所述音频数据的特征信息，包括：在获取所述音频数据后，将所述音频数据的每一帧进行解析；提取出与所述音频数据相对应的音素特征值作为特征信息。4.如权利要求2所述语音模拟方法，其特征在于，所述获取所述用户的语音模拟请求信息之后，还包括：判断所述用户的语音模拟请求信息是否具有与所述用户相对应的用户标识；若是，调出与所述用户标识相对应的所述模拟音频数据，并进行播放；若否，进行所述根据所述语音模拟请求信息设定与所述用户相对应的用户标识，以及与所述用户标识相对应的用于存储用户音频数据的存储空间的步骤。5.如权利要求1所述语音模拟方法，其特征在于，所述根据已保存的所述特征信息生成与所述音频数据相对应的模拟音频数据，包括：调取所述用户请求播放的预设音频数据；根据已保存的所述特征信息将所述预设音频数据转换为与所述音频数据相对应的所述模拟音频数据。6.一种语音模拟装置，其特征在于，包括：获取模块、提取模块、生成模块和播放模块；...

【专利技术属性】
技术研发人员：王斌，
申请(专利权)人：深圳易方数码科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人