文本播读方法、装置及客户端、服务器和存储介质制造方法及图纸

技术编号:18444955 阅读:20 留言:0更新日期:2018-07-14 10:23
本发明专利技术实施例提供一种文本播读方法、装置及客户端、服务器和存储介质,涉及互联网通信技术领域。该文本播读方法包括:提取待播读文本中的第一待播读分词,第一待播读分词与从服务器选择的词汇库内的分词对应;从用户语音库中调取与第一待播读分词对应的用户语音段,用户语音库包括用户依据词汇库内的分词录入的多个用户语音段;依据第一待播读分词在待播读文本中的顺序,播读与第一待播读分词对应的用户语音段。将待播读文本进行分词处理,得到多个待播读分词,并与用于预先选择的词汇库中的分词相比较,提取出对应的用户语音段,并按照待播读文本中词组的顺序播放提取的多个用户语音段,可以满足不同用户的个性化需求,提高用户的体验感。

Text broadcast reading method, device and client, server and storage medium

The embodiment of the invention provides a text broadcast method, a device, a client, a server and a storage medium, and relates to the field of Internet communication technology. The text broadcast and read methods include: extracting the first pending reading word in the pending text, the first pending word segmentation and the word segmentation in the vocabulary database selected from the server; the user voice segment corresponding to the first pending word segmentation is extracted from the user voice library, and the user voice library includes the user based on the words in the vocabulary library. A plurality of user voice segments, according to the order of the first broadcast read participle in the text to be broadcast, and broadcast the user voice segment corresponding to the first waiting to read participle. A number of pending text is processed to get a number of pending word segmentation words, and compared with the words used in the pre selected vocabulary library, the corresponding user voice segments are extracted, and the multiple user voice segments are played according to the sequence of words in the text to be read, which can be full of the individual needs of different users and can be improved. The user's sense of experience.

【技术实现步骤摘要】
文本播读方法、装置及客户端、服务器和存储介质
本专利技术涉及互联网通信
,具体而言,涉及文本播读方法、装置及客户端、服务器和存储介质。
技术介绍
随着互联网的持续发展,文本转语音播读(TextToSpeech,TTS)的技术已经广泛的应用于大量的数字化生活场景。其关键技术点在于对文本进行分词处理,再基于分词从TTS语音库检索出其关联的语音段,把各自独立的语音段数据按照原文本中的分词位置重新组织为一段连续的语音数据并进行播读。但是,使用的TTS语音库播读的语种(普通话,粤语,四川话)是有限的,语句段的语调也是统一的,而每用户对语调、语速等的需求不尽相同,不能满足用户的个性化需求。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种文本播读方法、装置及客户端和存储介质,通过用户自行选择不同阶级的词汇库,录入与词汇库对应的用户语音段,以满足用户的个性化需求。本专利技术实施例的另一目的在于提供一种服务器,以提供不同阶级的词汇库供用户选择,以满足用户的个性化需求。第一方面,本专利技术实施例提供一种文本播读方法,应用于客户端,所述方法包括:提取待播读文本中的第一待播读分词,所述第一待播读分词与从服务器选择的词汇库内的分词对应;从用户语音库中调取与所述第一待播读分词对应的用户语音段,所述用户语音库包括用户依据所述词汇库内的分词录入的多个用户语音段;依据所述第一待播读分词在所述待播读文本中的顺序,播读与所述第一待播读分词对应的用户语音段。第二方面,本专利技术实施例还提供一种文本播读装置,应用于客户端,所述装置包括:分词处理模块,用于提取待播读文本中的第一待播读分词,所述第一待播读分词与从服务器选择的词汇库内的分词对应;语音调取模块,用于从用户语音库中调取与所述第一待播读分词对应的用户语音段,所述用户语音库包括用户依据所述词汇库内的分词录入的多个用户语音段;播读模块,用于依据所述第一待播读分词在所述待播读文本中的顺序,播读与所述第一待播读分词对应的用户语音段。第三方面,本专利技术实施例还提供一种客户端,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的文本播读方法。第四方面,本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如上所述的文本播读方法。第五方面,本专利技术实施例还提供一种服务器,包括:存储器;处理器;及词汇库建立装置;所述词汇库建立装置存储于所述存储器中并包括一个或多个由所述处理器执行的软件功能模块,所述词汇库建立装置包括:提取模块,用于利用分词技术从多个文本中提取分词;排序模块,用于按照多个所述分词出现的频率进行排序;建库模块,用于建立不同阶级的词汇库,并将排序后的多个所述分词按照在多个文本中出现的比例归入对应阶级的词汇库。与现有技术相比,本专利技术实施例提供一种文本播读方法、装置、客户端及存储介质,该文本播读方法包括:提取待播读文本中的第一待播读分词,所述第一待播读分词与从服务器选择的词汇库内的分词对应;从用户语音库中调取与所述第一待播读分词对应的用户语音段,所述用户语音库包括用户依据所述词汇库内的分词录入的多个用户语音段;依据所述第一待播读分词在所述待播读文本中的顺序,播读与所述第一待播读分词对应的用户语音段。用户可以依据自己的需求和喜好,通过客户端预先从服务器获取对应的词汇库,依据词汇库语音输入与词汇库中的分词对应用户语音段,客户端将词汇库中的分词与用户语音段进行关联,建立相应的索引关系。在需要对文本进行播读时,客户端可以将待播读文本进行分词处理,得到多个待播读分词,并与用于预先选择的词汇库中的分词相比较,提取出对应的用户语音段,并按照待播读文本中词组的顺序播放提取的多个用户语音段,可以满足不同用户的个性化需求,提高用户的体验感。服务器可以按照每个分词在统计的所有的文本中出现的频率建立不同阶级的词汇库,不同阶级的词汇库中的分词个数不同,需要用户录入用户语音段的时间也不同。因此,服务器通过设置不同阶级的词汇库,可以满足不同用户的个性化需求,提高用户的体验感。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术实施例提供的服务器与客户端进行交互的示意图。图2为本专利技术实施例提供的客户端和服务器间的信令交互图。图3为本专利技术实施例提供的词汇库建立方法的流程图。图4为本专利技术第一实施例提供的文本播读方法的流程图。图5为本专利技术第二实施例提供的文本播读方法的流程图。图6为本专利技术第三实施例提供的文本播读方法的流程图。图7为本专利技术第三实施例提供的文本播读方法中步骤S14的子流程图。图8为本专利技术第四实施例提供的客户端的结构示意图。图9为本专利技术第四实施例提供的文本播读装置的功能模块图。图10为本专利技术第五实施例提供的文本播读装置的功能模块图。图11为本专利技术第六实施例提供的服务器的结构框图。图12为本专利技术第六实施例提供的词汇库建立装置的功能模块图。图标:100-客户端;200-服务器;300-网络;10-文本播读装置;11-第一处理器;12-第一存储器;13-总线;14-通信接口;101-词汇库选择模块;102-录入模块;103-关联模块;104-分词处理模块;105-语音调取模块;106-播读模块;1061-重组单元;1062-缓存单元;1063-加载单元;107-语音库选择模块;20-词汇库建立装置;21-第二存储器;22-存储控制器;23-第二处理器;201-提取模块;202-排序模块;203-建库模块。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。请参考图1,是本专利技术实施例提供的客户端100与服务器200进行交互的示意图。客户端100通过可以通过网络300与服务器200进行通信,于本专利技术实施例中,客户端100可以通过网络300从服务器200获取语音数据库、录入用户语音段所需要的词汇库等,对应的,服务器200可以提供词汇库、语音数据库的下载服务。容易理解的是,多个客户端100可以同时与服务器200通信连接,同时从服务器200获取语音数据库本文档来自技高网...

【技术保护点】
1.一种文本播读方法,应用于客户端,其特征在于,所述方法包括:提取待播读文本中的第一待播读分词,所述第一待播读分词与从服务器选择的词汇库内的分词对应;从用户语音库中调取与所述第一待播读分词对应的用户语音段,所述用户语音库包括用户依据所述词汇库内的分词录入的多个用户语音段;依据所述第一待播读分词在所述待播读文本中的顺序,播读与所述第一待播读分词对应的用户语音段。

【技术特征摘要】
1.一种文本播读方法,应用于客户端,其特征在于,所述方法包括:提取待播读文本中的第一待播读分词,所述第一待播读分词与从服务器选择的词汇库内的分词对应;从用户语音库中调取与所述第一待播读分词对应的用户语音段,所述用户语音库包括用户依据所述词汇库内的分词录入的多个用户语音段;依据所述第一待播读分词在所述待播读文本中的顺序,播读与所述第一待播读分词对应的用户语音段。2.根据权利要求1所述的文本播读方法,其特征在于,所述文本播读方法还包括:提取所述待播读文本中的第二待播读分词;从预设的语音数据库中调取与所述第二待播读分词对应的预设语音段;所述依据所述第一待播读分词在所述待播读文本中的顺序,播读与所述第一待播读分词对应的用户语音段的步骤包括:依据所述第一待播读分词和所述第二待播读分词在所述待播读文本中的顺序,播读与所述第一待播读分词对应的用户语音段以及与所述第二待播读分词对应的预设语音段。3.根据权利要求2所述的文本播读方法,其特征在于,所述文本播读方法还包括:对所述待播读文本进行分词处理得到待播读分词,当所述待播读分词与所述词汇库内的分词对应时,则执行所述提取待播读文本中的第一待播读分词的步骤;当所述待播读分词与所述词汇库内的分词不对应时,则执行所述提取所述待播读文本中的第二待播读分词的步骤。4.根据权利要求2所述的文本播读方法,其特征在于,所述方法还包括:依据所述第一待播读分词和所述第二待播读分词在所述待播读文本中的顺序,对所述第一待播读分词对应的用户语音段和所述第二待播读分词对应的预设语音段进行排列,生成待播读语音数据;将所述待播读语音数据存入播读缓存区;播读引擎依据所述待播读文本的播放进度从所述播读缓存区加载所述待播读语音数据,以进行播读。5.根据权利要求1至3任一所述的文本播读方法,其特征在于,在所述提取待播读文本中的分词的步骤之前还包括:依据用户的选择,从服务器选择对应阶级的词汇库;接收用户依据所述词汇库内的分词录入的多个用户语音段,并生成所述用户语音库。6.根据权利要求1至3任一所述的文本播读方法,其特征在于,所述方法还包括:将所述用户语音库中的所述多个用户语音段与所述词汇库内的分词进行关联,以生成相应的索引关系,并保存所述索引关系;所述从用户语音库中调取与所述第一待播读分词对应的用户语音段的步骤包括:依据所述索引关系从用户语音库中调取与所述第一待播读分词对应的用户语音段。7.根据权利要求1至3任一所述的文本播读方法,其特征在于,所述词汇库按照分词由高到低出现的频率,分为初阶词汇库、中阶词汇库、高阶词汇库、顶阶词汇库,其中,从所述初阶词汇库、所述中阶词汇库、所述高阶词汇库到所述顶阶词汇库覆盖的分词依次增多。8.根据权利要求2所述的文本播读方法,其特征在于,所述方法还包括:依据用户的选择,从所述服务器获取语音数据库。9.一种文本播读装置,应用于客户端,其特征在于,所述装置包括:分词处理模块,用于提取待播读文本中的第一待播读分词,所述第一待播读分词与从服务器选择的词汇库内的分词对应;语音调取模块,用于从用户语音库中调取与所述第一待播读分词对应的用户语音段,所述用户语音库包括用户依据所述词汇库内的分词录入的多个用户语音段;播读模块,用于依据所述第一待播读分词在所述待播读文本中的顺序...

【专利技术属性】
技术研发人员:吴伟勇
申请(专利权)人:广州市动景计算机科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1