一种基于语音合成的文字转语音方法及相关设备技术

技术编号:21895634 阅读:13 留言:0更新日期:2019-08-17 15:59
本发明专利技术涉及语音语义领域的语音合成技术,具体涉及一种基于语音合成的文字转语音方法及相关设备,所述方法包括:接收用户的扫描请求,将用户选取的待识别文字扫描成电子文本;通过文字转语音系统将电子文本转换成语音文本,并语音提醒用户转换成功;获取用户的语音播报请求,语音播报语音文本。上述方法通过利用TextRank算法迭代计算每个词语的权重,能够快速的将整段文字快速转换成语音。

A Text-to-Speech Method Based on Speech Synthesis and Related Equipment

【技术实现步骤摘要】
一种基于语音合成的文字转语音方法及相关设备
本专利技术涉及语音语义领域,特别是涉及一种基于语音合成的文字转语音方法及相关设备。
技术介绍
随着大数据时代的到来,随时随地了解世界各地的信息已成为人们日常生活中的一件重要事情,大数据的不仅带来了庞大的信息,同时这些信息也在改变着每个人的工作和生活,但是并不是每个人都可以随时随地的掌握自己关注的信息,其中盲人、儿童、老人就占据了很大的比例。现有的阅读辅助设备虽然可以读取很多信息,但是却集中于部分少数相互匹配的读物当中,而且价格昂贵,读取的信息也具有针对性,获取的内容较少,不能满足盲人、儿童、老人的收听需求,目前,普通手稿还占据着主要的市场,大多数盲人、儿童、老人主要的信息来源还是依靠他人,无法单独阅读,这给他们的工作和生活改善造成了极大的不便。目前将文字转换成语音过程中,存在着不能快速的将整段文字快速转换成语音的问题,导致在将文字书籍等文字材料转换成语音时需要耗费大量的时间,文字转换成语音的效率低下。
技术实现思路
基于此,有必要针对将文字转换成语音过程中,存在着不能快速的将整段文字快速转换成语音的问题,提供一种基于语音合成的文字转语音方法及相关设备。一种基于语音合成的文字转语音方法,包括:接收用户的扫描请求,调取文字扫描系统,将用户选取的待识别文字扫描成电子文本;通过正则表达式读取所述电子文本中的标点符号,将相邻两个所述标点符号之间的文本定义为单个独立句子,将所述电子文本切分为多个独立句子;通过TextRank算法分别确定多个所述独立句子中的关键词,利用分割字符串split在所述关键词与其他字之间添加一个空字符;通过预设的字转语音系统将所述独立句子中的字转化成言语波形,将所述独立句子中的空字符转化成静音,形成单个语音文件包;将各语音文件包进行语音合成,得到所述电子文本对应的语音文本。在一种可能的设计中,所述通过TextRank算法分别确定多个所述独立句子中的关键词,包括:对所述独立句子分词并作词性标注,保留词性标注后的名词、动词、形容词及副词,构建所述独立句子的词网,所述词网为词语与词语之间相互作用构成的一个关系网,将所述独立句子中每个词语当作所述词网中的一个节点;利用所述TextRank算法迭代计算出每个词语的权重排序结果,所述TextRank迭代计算的公式如下:其中,WS(Vi)为节点Vi在独立句子中的权值,d为阻尼系数,是预设的常数,wji为节点Vi与节点Vj之间的权重,Out(Vj)为节点Vj指向的节点的集合,节点Vk为节点Vj指向的节点,wjk为节点Vk与节点Vj之间的权重,WS(Vj)为节点Vj在独立句子中的权值;将所有节点的权值除以集合中最大的权值,得到所有节点的归一化权值,将所述归一化权值大于预设的权值阈值的节点对应的词语定义为关键词。在一种可能的设计中,所述将各语音文件包进行语音合成,得到所述电子文本对应的语音文本之后,所述方法还包括:通过语音交互系统提示所述用户提交语音参数设置请求,依据所述用户提交的语音参数设置请求自动设置语音参数。在一种可能的设计中,所述通过语音交互系统提示所述用户提交语音参数设置请求,依据所述用户提交的语音参数设置请求自动设置语音参数,包括:在将所述电子文本转换成语音文本后,通过预设的语音交互系统询问所述用户是否设置语音参数,并提示所述用户通过语音回复是或否,所述语言参数包括播报速度和播报语音;当获取到所述用户回复的语音为是时,提示所述用户选择播报等级,所述播报等级包括0.8倍慢速、正常速度、1.5倍快速、2倍快速、3倍快速,获取所述用户选择的播报等级,依据所述播报等级自动设置所述播报速度;提示所述用户选择特色语音,所述特色语音包括系统原声、热门语音、明星语音、声效语音,获取所述用户选择的特色语音,依据用户选择的特色语音自动设置所述播报语音;当获取到所述用户回复的语音为否时,默认播报速度为正常语速、播放语音为系统原声。在一种可能的设计中,所述获取所述用户的语音播报请求,将所述语音文本通过语音进行播报,包括:通过语音交互系统询问所述用户是否播报所述语音文本,并提示所述用户通过语音回复是或否;当获取到所述用户回复的语音为是时,获取预设在语音交互系统的语音参数,依据所述语音参数通过语音交互系统播报所述语音文本;当获取到所述用户回复的语音为否时,提示所述用户暂不播报语音,如有需要请重新扫描文字。基于相同的技术构思,本专利技术还提供了一种基于语音合成的文字转语音装置,所述一种基于语音合成的文字转语音装置,包括:文字扫描模块,设置为接收用户的扫描请求,调取文字扫描系统,将用户选取的待识别文字扫描成电子文本;文字转换模块,设置为文字转换模块,设置为通过正则表达式读取所述电子文本中的标点符号,将相邻两个所述标点符号之间的文本定义为单个独立句子,将所述电子文本切分为多个独立句子;通过TextRank算法分别确定多个所述独立句子中的关键词,利用分割字符串split在所述关键词与其他字之间添加一个空字符;通过预设的字转语音系统将所述独立句子中的字转化成言语波形,将所述独立句子中的空字符转化成静音,形成单个语音文件包;将各语音文件包进行语音合成,得到所述电子文本对应的语音文本。在一种可能的设计中,所述文字转换模块还用于:通过语音交互系统提示所述用户提交语音参数设置请求,依据所述用户提交的语音参数设置请求自动设置语音参数。在一种可能的设计中,所述文字转换模块还用于:在将所述电子文本转换成语音文本后,通过预设的语音交互系统询问所述用户是否设置语音参数,并提示所述用户通过语音回复是或否,所述语言参数包括播报速度和播报语音;当获取到所述用户回复的语音为是时,提示所述用户选择播报等级,所述播报等级包括0.8倍慢速、正常速度、1.5倍快速、2倍快速、3倍快速,获取所述用户选择的播报等级,依据所述播报等级自动设置所述播报速度;提示所述用户选择特色语音,所述特色语音包括系统原声、热门语音、明星语音、声效语音,获取所述用户选择的特色语音,依据用户选择的特色语音自动设置所述播报语音;当获取到所述用户回复的语音为否时,默认播报速度为正常语速、播放语音为系统原声。基于相同的构思,本申请提出一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行上述所述一种基于语音合成的文字转语音方法的步骤。基于相同的构思,本申请提出一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述一种基于语音合成的文字转语音方法的步骤。上述一种基于语音合成的文字转语音方法及相关设备,通过接收用户的扫描请求,调取文字扫描系统,将用户选取的待识别文字扫描成电子文本;通过文字转语音系统将所述电子文本转换成语音文本,并通过语音提醒提示所述用户转换成功;获取所述用户的语音播报请求,将所述语音文本通过语音进行播报。本专利技术通过文字转换、语音合成将文字转换成语音,为盲人、儿童、老人的阅读提供了极大的帮助,同时基于TextRank算法,精准识别文字,进一步提高了语音合成的精度和高度。附图说明图1为本专利技术一个实施例中一种基于语音合成的文字转语音方法的流程图;图2本文档来自技高网...

【技术保护点】
1.一种基于语音合成的文字转语音方法,其特征在于,包括:接收用户的扫描请求,调取文字扫描系统,将用户选取的待识别文字扫描成电子文本;通过正则表达式读取所述电子文本中的标点符号,将相邻两个所述标点符号之间的文本定义为单个独立句子,将所述电子文本切分为多个独立句子;通过TextRank算法分别确定多个所述独立句子中的关键词,利用分割字符串split在所述关键词与其他字之间添加一个空字符;通过预设的字转语音系统将所述独立句子中的字转化成言语波形,将所述独立句子中的空字符转化成静音,形成单个语音文件包;将各语音文件包进行语音合成,得到所述电子文本对应的语音文本。

【技术特征摘要】
1.一种基于语音合成的文字转语音方法,其特征在于,包括:接收用户的扫描请求,调取文字扫描系统,将用户选取的待识别文字扫描成电子文本;通过正则表达式读取所述电子文本中的标点符号,将相邻两个所述标点符号之间的文本定义为单个独立句子,将所述电子文本切分为多个独立句子;通过TextRank算法分别确定多个所述独立句子中的关键词,利用分割字符串split在所述关键词与其他字之间添加一个空字符;通过预设的字转语音系统将所述独立句子中的字转化成言语波形,将所述独立句子中的空字符转化成静音,形成单个语音文件包;将各语音文件包进行语音合成,得到所述电子文本对应的语音文本。2.如权利要求1所述的一种基于语音合成的文字转语音方法,其特征在于,所述通过TextRank算法分别确定多个所述独立句子中的关键词,包括:对所述独立句子分词并作词性标注,保留词性标注后的名词、动词、形容词及副词,构建所述独立句子的词网,所述词网为词语与词语之间相互作用构成的一个关系网,将所述独立句子中每个词语当作所述词网中的一个节点;利用所述TextRank算法迭代计算出每个词语的权重排序结果,所述TextRank迭代计算的公式如下:其中,WS(Vi)为节点Vi在独立句子中的权值,d为阻尼系数,是预设的常数,wji为节点Vi与节点Vj之间的权重,Out(Vj)为节点Vj指向的节点的集合,节点Vk为节点Vj指向的节点,wjk为节点Vk与节点Vj之间的权重,WS(Vj)为节点Vj在独立句子中的权值;将所有节点的权值除以集合中最大的权值,得到所有节点的归一化权值,将所述归一化权值大于预设的权值阈值的节点对应的词语定义为关键词。3.如权利要求1所述的一种基于语音合成的文字转语音方法,其特征在于,所述将各语音文件包进行语音合成,得到所述电子文本对应的语音文本之后,所述方法还包括:通过语音交互系统提示所述用户提交语音参数设置请求,依据所述用户提交的语音参数设置请求自动设置语音参数。4.如权利要求3所述的一种基于语音合成的文字转语音方法,其特征在于,所述通过语音交互系统提示所述用户提交语音参数设置请求,依据所述用户提交的语音参数设置请求自动设置语音参数,包括:在将所述电子文本转换成语音文本后,通过预设的语音交互系统询问所述用户是否设置语音参数,并提示所述用户通过语音回复是或否,所述语言参数包括播报速度和播报语音;当获取到所述用户回复的语音为是时,提示所述用户选择播报等级,所述播报等级包括0.8倍慢速、正常速度、1.5倍快速、2倍快速、3倍快速,获取所述用户选择的播报等级,依据所述播报等级自动设置所述播报速度;提示所述用户选择特色语音,所述特色语音包括系统原声、热门语音、明星语音、声效语音,获取所述用户选择的特色语音,依据用户选择的特色语音自动设置所述播报语音;当获取到所述用户回复的语音为否时,默认播报速度为正常语速、播放语音为系统原...

【专利技术属性】
技术研发人员:赵超
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1