用于处理文本的方法和装置制造方法及图纸

技术编号:19697428 阅读:20 留言:0更新日期:2018-12-08 12:38
本申请实施例公开了用于处理文本的方法和装置。该方法的一具体实施方式包括:获取待处理文本;分析待处理文本,得到待处理文本的情节信息,其中,情节信息用来描述待处理文本的内容;基于情节信息,确定待处理文本对应的语音特征信息,其中,语音特征信息用来表示待处理文本对应的语音的特征,语音特征信息包括以下至少一项:语速信息、音调信息和语气信息。该实施方式实现了通过对文本的分析处理得到文本对应的语音的语速、音调和语气等语音特征。

【技术实现步骤摘要】
用于处理文本的方法和装置
本申请实施例涉及计算机
,具体涉及用于处理文本的方法和装置。
技术介绍
随着电子产品的普及,用户逐渐依赖于电子阅读,从而产生了大量的电子阅读的应用产品。这些应用产品提供的服务功能也越来越多样化,包括有声阅读等功能。现有的有声阅读通常是将文本逐字转换成对应的音韵序列,然后根据音韵序列生成语音波形,最后根据语音波形合成语音。这种方式得到的文本对应的语音只是文本中逐字的标准发音。
技术实现思路
本申请实施例提出了用于处理文本的方法和装置。第一方面,本申请实施例提供了一种用于处理文本的方法,该方法包括:获取待处理文本;分析待处理文本,得到待处理文本的情节信息,其中,情节信息用来描述待处理文本的内容;基于情节信息,确定待处理文本对应的语音特征信息,其中,语音特征信息用来表示待处理文本对应的语音的特征,语音特征信息包括以下至少一项:语速信息、音调信息和语气信息。在一些实施例中,情节信息包括以下至少一项:人物状态信息、人物情绪信息、场景信息,其中,人物状态信息用于表示人物的生理状态,人物情绪信息用于表示人物的心理状态,场景信息用于表示待处理文本的内容描述的场面;以及基于情节信息,确定待处理文本对应的语音特征信息,包括:基于人物状态信息、人物情绪信息、场景信息中的至少一项,确定待处理文本对应的语速信息和音调信息。在一些实施例中,情节信息包括人物情感信息,其中,人物情感信息用于表示人物的思想感情;以及基于情节信息,确定待处理文本对应的语音特征信息,包括:基于情感信息,确定待处理文本对应的语气信息。在一些实施例中,基于情节信息,确定待处理文本对应的语音特征信息,包括:基于预设的情节关键词与语音特征信息的对应关系,确定与情节信息的匹配度最高的情节关键词对应的语音特征信息作为待处理文本对应的语音特征信息。在一些实施例中,基于情节信息,确定待处理文本对应的语音特征信息,包括:将情节信息输入至与情节信息对应的、预先训练的语音特征模型,得到语音特征信息,其中,语音特征模型用于表征情节信息与语音特征信息之间的对应关系。在一些实施例中,上述方法还包括:基于语音特征信息,合成待处理文本对应的语音。在一些实施例中,情节信息包括人物属性信息,其中,人物属性包括以下至少一项:名字、性别、年龄、音色、性格、籍贯、职业;以及上述基于语音特征信息,合成待处理文本对应的语音,包括:获取与人物属性信息匹配的基础语音数据;基于基础语音数据和语音特征信息,合成待处理文本对应的语音。第二方面,本申请实施例提供了一种用于处理文本的装置,该装置包括:获取单元,被配置成获取待处理文本;分析单元,被配置成分析待处理文本,得到待处理文本的情节信息,其中,情节信息用来描述待处理文本的内容;确定单元,被配置成基于情节信息,确定待处理文本对应的语音特征信息,其中,语音特征信息用来表示待处理文本对应的语音的特征,语音特征信息包括以下至少一项:语速信息、音调信息和语气信息。在一些实施例中,情节信息包括以下至少一项:人物状态信息、人物情绪信息、场景信息,其中,人物状态信息用于表示人物的生理状态,人物情绪信息用于表示人物的心理状态,场景信息用于表示待处理文本的内容描述的场面;以及确定单元进一步被配置成基于人物状态信息、人物情绪信息、场景信息中的至少一项,确定待处理文本对应的语速信息和音调信息。在一些实施例中,情节信息包括人物情感信息,其中,人物情感信息用于表示人物的思想感情;以及确定单元进一步被配置成基于情感信息,确定待处理文本对应的语气信息。在一些实施例中,确定单元进一步被配置成基于预设的情节关键词与语音特征信息的对应关系,确定与情节信息的匹配度最高的情节关键词对应的语音特征信息作为待处理文本对应的语音特征信息。在一些实施例中,确定单元进一步被配置成将情节信息输入至与情节信息对应的、预先训练的语音特征模型,得到语音特征信息,其中,语音特征模型用于表征情节信息与语音特征信息之间的对应关系。在一些实施例中,上述装置还包括:合成单元,被配置成基于语音特征信息,合成待处理文本对应的语音。在一些实施例中,情节信息包括人物属性信息,其中,人物属性包括以下至少一项:名字、性别、年龄、音色、性格、籍贯、职业;以及上述获取单元进一步被配置成获取与人物属性信息匹配的基础语音数据;上述合成单元进一步被配置成基于基础语音数据和语音特征信息,合成待处理文本对应的语音。第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于处理文本的方法和装置,通过获取待处理文本,并对其进行分析以得到待处理文本的情节信息。之后,根据待处理文本的情节信息,确定待处理文本的包括语速信息、音调信息和语气信息等语音特征信息,从而实现了通过对文本的分析处理得到文本对应的语音的语速、音调和语气等语音特征。进一步地,可以根据得到的语音特征,合成待处理文本对应的语音,使得合成的文本对应的语音具有对应的语音特征,有助于更生动地向听众传达文本的内容。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于处理文本的方法的一个实施例的流程图;图3是根据本申请的用于处理文本的方法的一个应用场景的示意图;图4是根据本申请的用于处理文本的方法的又一个实施例的流程图;图5是根据本申请的用于处理文本的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于处理文本的方法或用于处理文本的装置的实施例的示例性架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种能够获取和/或处理待处理文本的应用,例如网页浏览器应用、搜索类应用、社交平台软件、文本编辑类应用、文本处理类应用、阅读类应用等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持处理文本的各种电子设备,包括但不限于智能手机本文档来自技高网...

【技术保护点】
1.一种用于处理文本的方法,包括:获取待处理文本;分析所述待处理文本,得到所述待处理文本的情节信息,其中,所述情节信息用来描述所述待处理文本的内容;基于所述情节信息,确定所述待处理文本对应的语音特征信息,其中,所述语音特征信息用来表示所述待处理文本对应的语音的特征,所述语音特征信息包括以下至少一项:语速信息、音调信息和语气信息。

【技术特征摘要】
1.一种用于处理文本的方法,包括:获取待处理文本;分析所述待处理文本,得到所述待处理文本的情节信息,其中,所述情节信息用来描述所述待处理文本的内容;基于所述情节信息,确定所述待处理文本对应的语音特征信息,其中,所述语音特征信息用来表示所述待处理文本对应的语音的特征,所述语音特征信息包括以下至少一项:语速信息、音调信息和语气信息。2.根据权利要求1所述的方法,其中,所述情节信息包括以下至少一项:人物状态信息、人物情绪信息、场景信息,其中,所述人物状态信息用于表示人物的生理状态,所述人物情绪信息用于表示人物的心理状态,所述场景信息用于表示所述待处理文本的内容描述的场面;以及所述基于所述情节信息,确定所述待处理文本对应的语音特征信息,包括:基于所述人物状态信息、所述人物情绪信息、所述场景信息中的至少一项,确定所述待处理文本对应的语速信息和音调信息。3.根据权利要求1所述的方法,其中,所述情节信息包括人物情感信息,其中,所述人物情感信息用于表示人物的思想感情;以及所述基于所述情节信息,确定所述待处理文本对应的语音特征信息,包括:基于所述情感信息,确定所述待处理文本对应的语气信息。4.根据权利要求1所述的方法,其中,所述基于所述情节信息,确定所述待处理文本对应的语音特征信息,包括:基于预设的情节关键词与语音特征信息的对应关系,确定与所述情节信息的匹配度最高的情节关键词对应的语音特征信息作为所述待处理文本对应的语音特征信息。5.根据权利要求1所述的方法,其中,所述基于所述情节信息,确定所述待处理文本对应的语音特征信息,包括:将所述情节信息输入至与所述情节信息对应的、预先训练的语音特征模型,得到所述语音特征信息,其中,所述语音特征模型用于表征情节信息与语音特征信息之间的对应关系。6.根据权利要求1-5之一所述的方法,其中,所述方法还包括:基于所述语音特征信息,合成所述待处理文本对应的语音。7.根据权利要求6所述的方法,其中,所述情节信息包括人物属性信息,其中,人物属性包括以下至少一项:名字、性别、年龄、音色、性格、籍贯、职业;以及所述基于所述语音特征信息,合成所述待处理文本对应的语音,包括:获取与所述人物属性信息匹配的基础语音数据;基于所述基础语音数据和所述语音特征信息,合成所述待处理文本对应的语音。8.一种用于处理文本的装置,其中,所述装置包括:获取单元,被配置成获取待处理文本;分析单元,被配置成分析所述待处理文...

【专利技术属性】
技术研发人员:房伟伟
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1