文本信息的处理方法及装置、计算机设备和可读存储介质制造方法及图纸

技术编号:24498753 阅读:78 留言:0更新日期:2020-06-13 04:08
本申请实施例公开了一种文本信息的处理方法及装置、计算机设备和可读存储介质,适用于人工智能领域的情感语音合成,本申请实施例方法在为文本中的语句确定情感类别的过程中,不仅考虑了为该语句个体所预测的情感类别,还考虑了语句所在文本的整体情感类别,按照本申请实施例提供的方法为文本中语句生成语音信息,有利于为文本生成更加符合人的情感表达习惯的语音信息,提高智能语音设备的拟人程度。

Text information processing method and device, computer equipment and readable storage medium

【技术实现步骤摘要】
文本信息的处理方法及装置、计算机设备和可读存储介质
本申请涉及信息处理领域,尤其涉及一种文本信息的处理方法及装置、计算机设备和可读存储介质。
技术介绍
语音技术(SpeechTechnology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。近年来,语音合成技术取得了极大进步,机器语音播报在智能移动终端、智能家居、车载音响等设备上得以广泛应用。人们对语音合成的要求也不再仅仅是“能听清”,而是转变成“高度逼真,富有情感”,合成语音的质量成为衡量智能语音产品竞争力的一大重要因素。但是,目前缺少为文本信息生成符合人的情感表达习惯的语音信息的研究,这制约了拟人机器人的发展。
技术实现思路
本申请实施例提供了一种文本信息的处理方法及装置、计算机设备和可读存储介质,有利于为文本生成符合人的情感表达习惯的语音信息,提高智能语音设备的拟人程度。第一方面,本申请实施例提供一种文本信息的处理方法,包括:对目标文本进行语句划分,得到语句序列;确定所述目标文本的情感类别;分别确定所述语句序列中各语句的初始情感类别;基于所述目标文本的情感类别和所述语句序列中各语句的初始情感类别,从所述语句序列中确定出第一关键语句,所述第一关键语句的初始情感类别与所述目标文本的情感类别相同;根据所述第一关键语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别,所述目标语句为所述语句序列中与所述第一关键语句相邻的语句,且所述目标语句的初始情感类别与所述目标文本的情感类别不同;基于所述目标语句的修正情感类别生成所述目标语句的语音信息。人对文本中任一语句的含义的理解,通常不会孤立的进行,而是需要结合文本中的上下文来辅助理解该语句的含义。类似的,人对以语音形式表达的文本中任一语句的情感的理解和表达,同样如此。本申请实施例在为文本中的语句确定情感类别的过程中,不仅考虑了为该语句个体所预测的情感类别,还考虑了语句所在文本的整体情感类别,按照本申请实施例提供的方法为文本中语句生成语音信息,有利于为文本生成更加符合人的情感表达习惯的语音信息,提高智能语音设备的拟人程度。由于文本是非结构化的数据,为了便于计算机从文本中挖掘有用的信息,就需要将文本转化为计算机可处理的结构化形式的信息,称作文本特征,该文本特征一般为多维的向量。在一种可能的实现方式中,目标文本的文本特征可以是根据语句序列中各语句的文本特征得到的。在一种可能的实现方式中,所述对目标文本进行语句划分,包括:将所述目标文本按照语调短语划分规则进行语句划分。在一种可能的实现方式中,所述对目标文本进行语句划分,包括:预测目标文本的韵律信息;以语调短语为单位对目标文本进行语句划分,得到语句序列。语句序列中的每个语句为一个语调短语。在一种可能的实现方式中,文本的韵律信息可以用于指示目标文本中的韵律词、韵律短语和语调短语。韵律词是一组在实际语流中联系密切的、经常联在一起发音的音节。一般,可以先行预测目标文本中的韵律词。韵律短语是介于韵律词和语调短语之间的中等节奏组块。韵律短语可能小于句法上的短语,一个韵律短语一般包括一个或多个韵律词,韵律短语内部各个韵律词之间可能出现韵律上的节奏边界,具有相对稳定的短语语调模式和短语重音配置模式。韵律短语是指组成韵律短语的几个韵律词听起来是共用一个节奏群。预测得到目标文本的韵律词之后,可以根据预测得到的韵律词预测目标文本中的韵律短语。语调短语就是将几个韵律短语按照一定的语调模式连接起来,一个语调短语一般包括一个或多个韵律短语。预测得到目标文本的韵律短语之后,可以根据预测得到的韵律短语预测目标文本中的语调短语。在一种可能的实现方式中,语句序列中第一语句的文本特征可以为根据第一语句中各韵律词的文本特征得到的,第一语句可以为语句序列中的任意一个语句。在一种可能的实现方式中,韵律词的文本特征可以为根据韵律词的词向量和/或韵律词的位置特征生成的。在一种可能的实现方式中,韵律词的词向量可以是通过神经网络得到的,该神经网络可以是对Word2Vec模型或GloVe模型或Bert模型进行训练得到的。在一种可能的实现方式中,韵律词的位置特征可以用于表示该韵律词在所在语调短语中的位置。例如,一个韵律词的位置特征可以用一个25维的向量表示,该向量的第一至第十维用于表示该韵律词在语调短语中的次序,该向量的第十一至第二十维用于表示该语调短语中韵律词的个数,该向量第二十一至二十五维用于该韵律词的韵律结果,例如,韵律结果可以用于表示该韵律词是否位于韵律短语或语调短语的结尾。在一种可能的实现方式中,所述目标文本的情感类别为预先设定的,便于用户根据喜好设置语音信息的情感基调。或者,目标文本的情感类别可以为基于所述目标文本的文本特征获得的。在一种可能的实现方式中,所述分别确定所述语句序列中各语句的初始情感类别,具体为:基于所述语句序列中待确定语句的文本特征确定所述待确定语句的初始情感类别。在一种可能的实现方式中,所述根据所述第一关键语句的初始情感类别、目标语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别,具体为:基于所述目标语句除所述第一关键语句外的另一相邻语句的初始情感类别与所述目标文本的情感类别相同,根据所述第一关键语句的初始情感类别、所述另一相邻语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别。在一种可能的实现方式中,在一种可能的实现方式中,在得到所述目标语句的修正情感类别之后,所述方法还包括:基于所述目标语句除所述第一关键语句外的另一相邻语句的初始情感类别与所述目标文本的情感类别不同,根据所述目标语句的修正情感类别和所述另一相邻语句的文本特征得到所述另一相邻语句的修正情感类别;基于所述另一相邻语句的修正情感类别生成所述另一相邻语句的语音信息。以关键语句为中心,依次修正其左右非关键语调短语的情感类别,有利于保持目标文本中相邻语句间情感变化的连贯性。第二方面,本申请实施例提供一种文本信息的处理装置,该装置包括用于执行上述第一方面或第一方面任意一种可能实现方式的方法的一个或多个功能单元。这些功能单元可以通过硬件实现,或者可以通过硬件执行相应的软件实现,或者由软件结合必要的硬件实现。在一种可能的实现方式中,文本信息的处理装置可以包括:语句划分模块,用于对目标文本进行语句划分,得到语句序列;确定模块,用于执行如下步骤:确定所述目标文本的情感类别;分别确定所述语句序列中各语句的初始情感类别;基于所述目标文本的情感类别和所述语句序列中各语句的初始情感类别,从所述语句序列中确定出第一关键语句,所述第一关键语句的初始情感类别与所述目标文本的情感类别相同;根据所述第一关键语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别,所述目标语句为所述语句序列中与所本文档来自技高网...

【技术保护点】
1.一种文本信息的处理方法,其特征在于,包括:/n对目标文本进行语句划分,得到语句序列;/n确定所述目标文本的情感类别;/n分别确定所述语句序列中各语句的初始情感类别;/n基于所述目标文本的情感类别和所述语句序列中各语句的初始情感类别,从所述语句序列中确定出第一关键语句,所述第一关键语句的初始情感类别与所述目标文本的情感类别相同;/n根据所述第一关键语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别,所述目标语句为所述语句序列中与所述第一关键语句相邻的语句,且所述目标语句的初始情感类别与所述目标文本的情感类别不同;/n基于所述目标语句的修正情感类别生成所述目标语句的语音信息。/n

【技术特征摘要】
1.一种文本信息的处理方法,其特征在于,包括:
对目标文本进行语句划分,得到语句序列;
确定所述目标文本的情感类别;
分别确定所述语句序列中各语句的初始情感类别;
基于所述目标文本的情感类别和所述语句序列中各语句的初始情感类别,从所述语句序列中确定出第一关键语句,所述第一关键语句的初始情感类别与所述目标文本的情感类别相同;
根据所述第一关键语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别,所述目标语句为所述语句序列中与所述第一关键语句相邻的语句,且所述目标语句的初始情感类别与所述目标文本的情感类别不同;
基于所述目标语句的修正情感类别生成所述目标语句的语音信息。


2.根据权利要求1所述的方法,其特征在于,所述对目标文本进行语句划分,包括:
将所述目标文本按照语调短语划分规则进行语句划分。


3.根据权利要求1所述的方法,其特征在于,所述目标文本的情感类别为预先设定的,或者,为基于所述目标文本的文本特征获得的。


4.根据权利要求1所述的方法,其特征在于,所述分别确定所述语句序列中各语句的初始情感类别,具体为:
基于所述语句序列中待确定语句的文本特征确定所述待确定语句的初始情感类别。


5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述第一关键语句的初始情感类别、目标语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别,具体为:
基于所述目标语句除所述第一关键语句外的另一相邻语句的初始情感类别与所述目标文本的情感类别相同,根据所述第一关键语句的初始情感类别、所述另一相邻语句的初始情感类别和所述目标语句的文本特征得到所述目标语句的修正情感类别。


6.根据权利要求1至5中任一项所述的方法,其特征在于,在得到所述目标语句的修正情感类别之后,所述方法还包括:
基于所述目标语句除所述第一关键语句外的另一相邻语句的初始情感类别与所述目标文本的情感类别不同,根据所述目标语句的修正情感类别和所述另一相邻语句的文本特征得到所述另一相邻语句的修正情感类别;
基于所述另一相邻语句的修正情感类别生成所述另一相邻语句的语音信息。


7.一种文本信息的处理装置,其特征在于,包括:
语句划分模块,用于对目标文本进行语句划分,得到语句序列;
确定模块,用于执行如下步骤:
确定所述目标文本的情感类别;
分...

【专利技术属性】
技术研发人员:邓利群魏建生张旸王雅圣孙文华
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1