一种电子阅读装置和语音阅读加载方法制造方法及图纸

技术编号:13569529 阅读:50 留言:0更新日期:2016-08-21 11:49
本发明专利技术提供了一种电子阅读装置和语音阅读加载方法。所述语音阅读加载方法包括:排版引擎对解析后的文本进行排版,包括:以预设的断句规则对该文本进行断句并记录顺序断出的每个句子的坐标信息和相应句子数目;以所述预设的断句规则对排版完的文本进行断句并且在断好的每一个句子的结束位置添加一个唯一标识,形成携带有唯一标识的新句子;将断出的新句子发送给语音合成引擎以合成音频数据并且记录与新句子对应的起始字符位置以及合成的句子数目;从选定的句子开始执行语音朗读。

【技术实现步骤摘要】

本专利技术涉及计算机
,具体而言涉及一种电子阅读装置和语音阅读加载方法
技术介绍
目前市场上常见的电子书籍阅读软件具有听书功能(即语音朗读),但都需要将阅读的文字数据传送给语音合成引擎进行语音合成,从而将文字或单词转化成语音数据。转化的过程都是通过转化的字符数来计算进度,例如一个文本有3句话,第一句有20个字符,第二句有10个字符,第三句有30个字符;当合成到第40个字符后,语音引擎的合成进度就是67%,通过这个进度只能知道当前的字符位置,但没办法定位到当前进度是第几句话,这是因为现有的语音合成引擎不具备断句功能。这样就带来了一个问题:当用户需要跳句来听语音朗读时,例如从第一句直接跳到第三句来听语音朗读,此时没法确定该第三句话是否已经合成为语音数据,这就只能重新再合成一遍。这种工作方式对终端设备的性能造成了极大的浪费,尤其是智能移动终端,并且执行跳句的语音朗读的速度会很慢,尤其选择的句子靠后时,例如第15句、第20句、或第30句等,这会造成用户的体验感很差。
技术实现思路
本专利技术的目的在于提供一种电子阅读装置和语音阅读加载方法,以改善上述的问题。本专利技术实施例提供了一种语音阅读加载方法,其包括:排版引擎对解析后的文本进行排版,包括:以预设的断句规则对该文本进行断句并记录顺序断出的每个句子的坐标信息和相应句子数目;以所述预设的断句规则对排版完的文本进行断句并且在断好的每一个句子的结束位置添加一个唯一标识,形成携带有唯一标识的新句子;将断出的新句子发送给语音合成引擎以合成音频数据并且记录与新句子对应的起始字符位置以及合成的句子数目;从选定的句子开始执行语音朗读。优选的,所述每个句子的坐标信息包括每个句子在屏幕上显示的每一行的起始字符和结束字符在该屏幕上的坐标。优选的,其中所述预设的断句规则是根据标点符号的作用来预先设置的,其中将显示的最后一个表示句尾的标点符号之后的最后一段话默认为一个句子。优选的,其中所述预设的断句规则还包括:对一个句子包含的文字或单词数量预设置一个阈值,当一个句子所包含的文字或单词数量超过该阈值时默认阈值数以内的所有文字或单词为1个句子。优选的,其中所述预设的断句规则还包括:对一个句子包含的文字或单词数量预设一个阈值,当一个句子所包含的文字或单词数量超过该阈值时在阈值数以内的所有文字或单词当中找其他标点符号,以最后一个标点符号表示该句子的结束。优选的,其中所述唯一标识是一个字符串,并且作为唯一标识的字符串与表示文本内容的字符串不同。优选的,其中在发送时,用一个数据包将断好的所有携带有唯一标识的新句子一次性发送给语音合成引擎。优选的,其中在合成音频数据并且记录与新句子对应的起始字符位置以及合成的句子数目的步骤中,用数组形式的数据集合来保存与新句子对应的起始字符位置以及合成的句子数目,每当合成进度到唯一标识位置时合成的句子数目自动加1,同时记录与该句子的起始字符对应的位置,从而记录下每一个新句子的起始字符为在屏幕上显示的1页文字的文字字符数据中的第几个以及该句子为被合成的第几个句子。优选的,其中在从选定的句子开始执行语音朗读的步骤中,当选择从首句开始语音朗读时,直接执行语音朗读;当选择跳句语音朗读时,根据排版引擎记录的句子的坐标信息和相应句子数目以及语音合成引擎记录的新句子的起始字符位置和合成的句子数目,执行语音朗读。优选的,其中在当选择跳句语音朗读时,根据排版引擎记录的句子的坐标信息和相应句子数目以及语音合成引擎记录的新句子的起始字符位置和合成的句子数目,执行语音朗读的步骤中,通过选定的句子的坐标信息和排版引擎记录的句子的坐标信息和相应句子数目来得到所选定的句子的相应句子数目,将所选定的句子的相应句子数目与记录的合成的句子数目进行比较,当所选定的句子的相应句子数目小于记录的合成的句子数目时直接执行语音朗读;当所选定的句子的相应句子数目大于等于记录的合成的句子数目时先将所选定的句子发送给语音合成引擎记录进行语音合成,然后再进行语音朗读。本专利技术实施例还提供了一种电子阅读装置,包括:排版引擎,用于对解析后的文本进行排版,包括:以预设的断句规则对该文本进行断句并记录顺序断出的每个句子的坐标信息和相应句子数目;断句单元,用于以所述预设的断句规则对排版完的文本进行断句并且在断好的每一个句子的结束位置添加一个唯一标识,形成携带有唯一标识的新句子;发送单元,用于将断出的新句子发送给语音合成引擎;语音合成引擎,用于将接收的文本合成音频数据并且记录与新句子对应的起始字符位置以及合成的句子数目;语音朗读单元,用于语音朗读合成的音频数据。优选的,其中所述每个句子的坐标信息包括每个句子在屏幕上显示的每一行的起始字符和结束字符在该屏幕上的坐标。优选的,其中所述预设的断句规则是根据标点符号的作用来预先设置的,其中将显示的最后一个表示句尾的标点符号之后的最后一段话默认为一个句子。优选的,其中所述预设的断句规则还包括:对一个句子包含的文字或单词数量预设一个阈值,当一个句子所包含的文字或单词数量超过该阈值时默认阈值数以内的所有文字或单词为1个句子。优选的,其中所述预设的断句规则还包括:对一个句子包含的文字或单词数量预设置一个阈值,当一个句子所包含的文字或单词数量超过该阈值时在阈值数以内的所有文字或单词当中找其他标点符号,以最后一个标点符号表示该句子的结束。优选的,其中所述唯一标识是一个字符串,并且作为唯一标识的字符串与表示文本内容的字符串不同。优选的,其中发送单元在发送时,用一个数据包将断好的所有携带有唯一标识的新句子一次性发送给语音合成引擎。优选的,其中语音合成引擎使用数组形式的数据集合来保存与新句子对应的起始字符位置以及合成的句子数目,每当合成进度到唯一标识位置时合成的句子数目自动加1,同时记录与该句子的起始字符对应的位置,从而记录下每一个新句子的起始字符为在屏幕上显示的1页文字的文字字符数据中的第几个以及该句子为被合成的第几个句子。优选的,其中语音朗读单元在语音朗读合成的音频数据时,或者从首句开始语音朗读,或者跳到中间句开始语音朗读,当选择跳句语音朗读时,所述语音朗读单元根据排版引擎记录的句子的坐标信息和相应句子数目以及语音合成引擎记录的新句子的起始字符位置和合成的句子数目,执行语音朗读。优选的,其中语音朗读单元通过选定的句子的坐标信息和排版引擎记录的句子的坐标信息和相应句子数目来得到所选定的句子的相应句子数目,将所选定的句子的相应句子数目与记录的合成的句子数目进行比较,当所选定的句子的相应句子数目小于记录的合成的句子数目时直接执行语音朗读;当所选定的句子的相应句子数目大于等于记录的合成的句子数目时先将所选定的句子发送给语音合成引擎记录进行语音合成,然后再进行语音朗读。有益效果:本专利技术实施例提供的电子阅读装置及语音阅读加载方法,能够提前对需要转化成语音的文字或单词信息进行断句,在断好的每个句子的结束位置添加一个唯一标识,虽然现有的语音合成引擎不具备断句功能,但在本专利技术的技术方案里使用现有的语音合成引擎可以通过识别唯一标识来获知每个句子的结束,这样就可以除了合成语音之外还能够记录与每个句子对应的起始字符位置以及合成的句子数目,从而能够根据记录的字符位置进行跳句朗读,而不需要本文档来自技高网...

【技术保护点】
一种语音阅读加载方法,其包括:排版引擎对解析后的文本进行排版,包括:以预设的断句规则对该文本进行断句并记录顺序断出的每个句子的坐标信息和相应句子数目;以所述预设的断句规则对排版完的文本进行断句并且在断好的每一个句子的结束位置添加一个唯一标识,形成携带有唯一标识的新句子;将断出的新句子发送给语音合成引擎以合成音频数据并且记录与新句子对应的起始字符位置以及合成的句子数目;从选定的句子开始执行语音朗读。

【技术特征摘要】
1.一种语音阅读加载方法,其包括:排版引擎对解析后的文本进行排版,包括:以预设的断句规则对该文本进行断句并记录顺序断出的每个句子的坐标信息和相应句子数目;以所述预设的断句规则对排版完的文本进行断句并且在断好的每一个句子的结束位置添加一个唯一标识,形成携带有唯一标识的新句子;将断出的新句子发送给语音合成引擎以合成音频数据并且记录与新句子对应的起始字符位置以及合成的句子数目;从选定的句子开始执行语音朗读。2.根据权利要求1所述的语音阅读加载方法,其中所述每个句子的坐标信息包括每个句子在屏幕上显示的每一行的起始字符和结束字符在该屏幕上的坐标。3.根据权利要求1所述的语音阅读加载方法,其中所述预设的断句规则是根据标点符号的作用来预先设置的,其中将显示的最后一个表示句尾的标点符号之后的最后一段话默认为一个句子。4.根据权利要求3所述的语音阅读加载方法,其中所述预设的断句规则还包括:对一个句子包含的文字或单词数量预设一个阈值,当一个句子所包含的文字或单词数量超过该阈值时默认阈值数以内的所有文字或单词为1个句子。5.根据权利要求3所述的语音阅读加载方法,其中所述预设的断句规则还包括:对一个句子包含的文字或单词数量预设置一个阈值,当一个句子所包含的文字或单词数量超过该阈值时在阈值数以内的所有文字或单词当中找其他标点符号,以最后一个标点符号表示该句子的结束。6.根据权利要求1所述的语音阅读加载方法,其中所述唯一标识是一个字符串,并且作为唯一标识的字符串与表示文本内容的字符串不同。7.根据权利要求1所述的语音阅读加载方法,其中在发送时,用一个数据包将断好的所有携带有唯一标识的新句子一次性发送给语音合成引擎。8.根据权利要求1所述的语音阅读加载方法,其中在合成音频数据并且记录与新句子对应的起始字符位置以及合成的句子数目的步骤中,用数组形式的数据集合来保存与新句子对应的起始字符位置以及合成的句子数目,每当合成进度到唯一标识位置时合成的句子数目自动加1,同时记录与该句子的起始字符对应的位置,从而记录下每一个新句子的起始字符为在屏幕上显示的1页文字的文字字符数据中的第几个以及该句子为被合成的第几个句子。9.根据权利要求1所述的语音阅读加载方法,其中在从选定的句子开始执行语音朗读的步骤中,当选择从首句开始语音朗读时,直接执行语音朗读;当选择跳句语音朗读时,根据排版引擎记录的句子的坐标信息和相应句子数目以及语音合成引擎记录的新句子的起始字符位置和合成的句子数目,执行语音朗读。10.根据权利要求9所述的语音阅读加载方法,其中在当选择跳句语音朗读时,根据排版引擎记录的句子的坐标信息和相应句子数目以及语音合成引擎记录的新句子的起始字符位置和合成的句子数目,执行语音朗读的步骤中,通过选定的句子的坐标信息和排版引擎记录的句子的坐标信息和相应句子数目来得到所选定的句子的相应句子数目,将所选定的句子的相应句子数目与记录的合成的句子数目进行比较,当所选定的句子的相应句子数目小于记录的合成的句子数目时直接执行语音朗读;当所选定的句子的相应句子数目大于等于记录的合成的句子数目时先将所选定的句子发送...

【专利技术属性】
技术研发人员:尤洋
申请(专利权)人:广州阿里巴巴文学信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1