电子书诵读方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：20921864 阅读：25 留言：0更新日期：2019-04-20 10:49

本发明专利技术实施例公开了一种电子书诵读方法、装置、计算机设备及存储介质，在进行电子书诵读之前，首先，将需要诵读的文字字段转化为数组矩阵，然后，通过训练至收敛状态用于对文字字段转化的数据矩阵进行情感分类的神经网络模型，对数组矩阵进行分类，得到该文字字段所表达的情感，最后，通过分类的到的情感在音频数据库中查找与该情感具有相同情感表达的语音库，调用该语音库中音频数据对文字字段进行音频转换，能够使文字字段转换的语音具有情感表达，即能够有感情的对电子书的内容进行诵读。因此，能够在语音播放电子书时，使电子书的诵读与文字表达情感相同，能够真正的模拟真人诵读的声音和情感，情感表达丰富引人入胜，提高用户收听体验。

E-book reading methods, devices, computer equipment and storage media

The embodiment of the present invention discloses an e-book reading method, device, computer equipment and storage medium. Before reading an e-book, first of all, the text field to be read is transformed into an array matrix. Then, the neural network model for emotional classification of the data matrix to be transformed into a text field is trained to convergence state, and the array matrix is classified. Finally, through classifying the emotions expressed in the text field, the voice database with the same emotional expression can be found in the audio database, and the audio data in the voice database can be invoked to convert the text field into audio. The voice converted by the text field can have emotional expression, that is, the content of the electronic book can be read emotionally. Therefore, when playing e-books in voice, it can make the reading of e-books the same as the expression of emotions in text. It can truly simulate the voice and emotions of real person reading. The expression of emotions is rich and fascinating, and it can improve the user's listening experience.

全部详细技术资料下载

【技术实现步骤摘要】
电子书诵读方法、装置、计算机设备及存储介质
本专利技术实施例涉及音频播放领域，尤其是一种电子书诵读方法、装置、计算机设备及存储介质。
技术介绍
眼睛和耳朵是人类接触事物最直接的感官器官，其中，文字是以眼睛感官为接收媒介的信息记录和传播途径，而语言则是以耳朵的听觉为接收媒介的信息传播途径。相比于语言的发声文字因为更容易被记录被人们作为最直接的信息获取方式。但是，在一些应用场景中，人们需要将文字信息转换为语音进行阅读。现有技术中，人们在使用电子书进行阅读时，能够选择将电子书中的文字信息转化为语音进行收听。其中，转换方式为将每个字对应的发音进行记录，进入转换模式后调用转换文本中文字对应的发音，并将单个字的发音按文字的排版顺序进行组合生成发音组合，然后播放该发音组合完成文字信息转化为语音信息的过程。本专利技术创造的专利技术人在研究中发现，现有技术中文字信息转化为语音信息后，自始至终均是由一个音调和音色进行发音，转化后的语音信息发音方式千篇一律，无法表达文字所要表达的情感，长期播放会引起用户的不适，导致用户体验较差。
技术实现思路
本专利技术实施例提供一种通过识别文字字段表达的...

【技术保护点】
1.一种电子书诵读方法，其特征在于，包括：获取待诵读的文字字段；根据预设的转换方式将所述文字字段转换为数组矩阵，并将所述数组矩阵输入至预设的情感识别模型中，其中，所述情感识别模型为预先训练至收敛状态用于对数据所表征情感信息进行分析的神经网络模型；读取所述情感识别模型输出的表征所述文字字段所表达的情感的分类信息；在预设的音频数据库中查找与所述分类信息具有映射关系的语音库，并调用所述语音库中的音频数据对所述文字字段进行语音转换，其中，所述语音库中的音频数据所表达的情感与所述分类数据表征的情感信息相同或相似。

【技术特征摘要】
1.一种电子书诵读方法，其特征在于，包括：获取待诵读的文字字段；根据预设的转换方式将所述文字字段转换为数组矩阵，并将所述数组矩阵输入至预设的情感识别模型中，其中，所述情感识别模型为预先训练至收敛状态用于对数据所表征情感信息进行分析的神经网络模型；读取所述情感识别模型输出的表征所述文字字段所表达的情感的分类信息；在预设的音频数据库中查找与所述分类信息具有映射关系的语音库，并调用所述语音库中的音频数据对所述文字字段进行语音转换，其中，所述语音库中的音频数据所表达的情感与所述分类数据表征的情感信息相同或相似。2.根据权利要求1所述的电子书诵读方法，其特征在于，所述在预设的音频数据库中查找与所述分类信息具有映射关系的语音库，并调用所述语音库中的音频数据对所述文字字段进行语音转换之前，还包括：获取表述所述文字字段的人物信息；根据所述人物信息在预设的角色数据库查找与所述人物信息具有映射关系的角色设定信息，其中，所述角色设定信息中包括表述所述文字字段的人物的性别信息。3.根据权利要求2所述的电子书诵读方法，其特征在于，所述在预设的音频数据库中查找与所述分类信息具有映射关系的语音库，并调用所述语音库中的音频数据对所述文字字段进行语音转换包括：在所述音频数据库中查找与所述分类信息和所述性别信息具有映射关系的语音库，并调用所述语音库中的音频数据对所述文字字段进行语音转换，其中，所述语音库中的音频数据的音调与所述性别信息表征的人物性别的音调相同。4.根据权利要求1所述的电子书诵读方法，其特征在于，所述在预设的音频数据库中查找与所述分类信息具有映射关系的语音库，并调用所述语音库中的音频数据对所述文字字段进行语音转换之后，还包括：在预设的音乐数据库中查找与所述分类信息具有映射关系背景音乐，其中，所述背景音乐所表达的情感与所述分类数据表征的情感信息相同或相似；在播放所述文字字段转换的语音数据时，播放所述背景音乐，其中，所述背景音乐的播放音量小于所述语音数据的播放音量。5.根据权利要求1所述的电子书诵读方法，其特征在于，所述在预设的音频数据库中查找与所述分类信息具有映射关系的语音库，并调用所述语音库中的音频数据对所述文字字段进行语音转换之后，还包括：获取目标用户的体表参数，其中，所述体表参数为检测人体的一项或者多项体表参数的参数数据；将所述参数数据转化...

【专利技术属性】
技术研发人员：张誉怀，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人