将书面文本转换为口语文本的方法及系统技术方案

技术编号:17561788 阅读:72 留言:0更新日期:2018-03-28 12:17
本发明专利技术公开了一种将书面文本转换为口语文本的方法,所述方法包括:接收待转换的源文本数据;对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;依次将每句源文本数据的词向量序列输入预先构建的文本转换模型,根据所述文本转换模型的输出得到所述源文本数据对应的目标文本数据;在所述目标文本数据中插入副语言信息,得到带有副语言信息的口语化文本数据。利用本发明专利技术,可以使转换后的口语文本更符合口语表达的习惯。

The method and system for converting written text into spoken text

The invention discloses a written text into spoken text, the method comprises: receiving the source text data to be converted; the source text data segmentation and vectorization, get the word vector sequence every sentence in the source text data; sequentially converts text sentence text data source model the word vector sequence input pre built, according to the data output of the target text text conversion model to obtain the data corresponding to the source text; insert nonverbal messages in the target text data, text data are spoken with vice language information. The use of the invention can make the converted spoken text more in line with the habit of oral expression.

【技术实现步骤摘要】
将书面文本转换为口语文本的方法及系统
本专利技术涉及自然语言处理领域,具体涉及一种将书面文本转换为口语文本的方法及系统。
技术介绍
语言是人们用来进行交际的系统,通常有两种不同的表现形式,即口语和书面语。口语即口头语言,书面语即用文字书写的语言,二者有着不同的特点。一般来说,口语比书面语灵活简短,对语境的依赖性比较强,表达时常伴有副语言现象,如喘息、拖音、停顿等,从而使口语听起来比书面语亲切自然,更容易理解,因此,为了便于人们理解,研究人员提出,可以将书面文本转换成口语化文本。现有的文本转换方法在将书面语转换为口语时,一般是直接在书面语上加入一些口语中经常出现的副语言信息。具体加入时,通过预先设定的规则,对书面文本进行文本分析后,确定副语言信息加入的位置,直接将副语言信息添加到相应书面语上;如对书面文本“中国社会和经济已发生翻天覆地的变化”添加停顿后得到转换后的口语化文本“中国社会和经济#已发生翻天覆地的变化”,其中,“#”为停顿标识符。现有的文本转换方法直接对书面文本进行分析添加相应副语言后得到转换后的口语化文本,转换后的口语化文本只是简单地在书面文本上添加了口语中常见的副语言信息,转换后的口语化文本并不符合语言的表达习惯,有时在书面文本中出现了口语化的副语言信息反而会让用户感觉到生硬、拗口,表达不流畅等感觉,严重影响用户体验。
技术实现思路
本专利技术实施例提供一种将书面文本转换为口语文本的方法及系统,以使转换后的口语文本更符合口语表达的习惯。为此,本专利技术提供如下技术方案:一种将书面文本转换为口语文本的方法,所述方法包括:接收待转换的源文本数据;对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;依次将每句源文本数据的词向量序列输入预先构建的文本转换模型,根据所述文本转换模型的输出得到所述源文本数据对应的目标文本数据;在所述目标文本数据中插入副语言信息,得到带有副语言信息的口语化文本数据。优选地,所述方法还包括:所述文本转换模型的构建过程包括:确定文本转换模型的拓扑结构,所述拓扑结构包括编码网络和解码网络,所述编码网络的输入为词向量序列、输出为词编码向量;所述解码网络的输入为所述编码网络输出的词编码向量及当前待转换词之前的历史词向量、输出为目标文本序列;收集大量文本数据,所述文本数据包括书面语文本数据及与其对应的口语化文本数据;对所述书面语文本数据进行分词及向量化处理,得到每句书面语文本数据的词向量序列;根据所述词向量序列及对应的目标文本数据训练模型参数,在训练过程中依次将每句源文本数据的词向量序列输入所述编码网络,利用所述解码网络输出的目标文本序列与所述源文本数据对应的目标文本数据之间的差值对模型参数进行更新;并在训练结束后,得到模型参数。优选地,所述方法还包括:在所述目标文本数据中插入副语言信息之前,确定所述目标文本数据是否需要进行词序调整;如果需要,则对所述目标文本数据进行词序调整。优选地,所述确定所述目标文本数据是否需要进行词序调整包括:计算所述目标文本数据的语言模型得分;如果所述得分低于设定阈值,则根据预先构建的词序调整判断模型依次判断所述目标文本数据中相邻词的词序是否需要调整。优选地,所述根据预先构建的词序调整判断模型依次判断所述目标文本数据中相邻词的词序是否需要调整包括:依次将所述目标文本数据中的各词作为当前待判定词,将所述当前待判断词及其上下文信息输入所述词序调整判断模型,根据所述词序调整判断模型的输出确定是否对当前待判断词及其相邻词的词序进行调整。优选地,所述待判定词的上下文信息包括以下任意一项或多项:所述待判断词的前、后一个或多个词,所述待判断词所属句子的语义信息,所述待判断词所属句子的语言模型得分。优选地,所述在所述目标文本数据中插入副语言信息包括:将所述目标文本数据的词序列输入预先构建的位置预测模型,根据所述位置预测模型的输出确定每种副语言信息的插入位置;在每种副语言信息的插入位置插入对应的副语言信息。优选地,所述位置预测模型的输出为:副语言信息的类型和位置,或者副语言信息的位置。优选地,所述位置预测模型的构建过程包括:确定位置预测模型的拓扑结构;收集大量文本数据,所述文本数据包括:不带副语言信息的文本数据及与其对应的带副语言信息的文本数据;对所述不带副语言信息的文本数据进行分词及向量化处理,得到每句不带副语言信息的文本数据的词向量序列;根据所述词向量序列及对应的带副语言信息的文本数据训练模型参数,在训练过程中,以每种副语言信息的预测插入位置与对应的带副语言信息的文本数据中所述副语言信息的实际位置的差值最小化为目标,对模型参数进行更新;并在训练结束后,得到模型参数。一种将书面文本转换为口语文本的系统,所述系统包括:接收模块,用于接收待转换的源文本数据;分词处理模块,用于对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;文本转换模块,用于依次将每句源文本数据的词向量序列输入预先构建的文本转换模型,根据所述文本转换模型的输出得到所述源文本数据对应的目标文本数据;信息插入模块,用于在所述目标文本数据中插入副语言信息,得到带有副语言信息的口语化文本数据。优选地,所述系统还包括:文本转换模型构建模块,用于构建所述文本转换模型;所述文本转换模型构建模块包括:第一结构确定单元,用于确定文本转换模型的拓扑结构,所述拓扑结构包括编码网络和解码网络,所述编码网络的输入为词向量序列、输出为词编码向量;所述解码网络的输入为所述编码网络输出的词编码向量及当前待转换词之前的历史词向量、输出为目标文本序列;第一数据收集单元,用于收集大量文本数据,所述文本数据包括书面语文本数据及与其对应的口语化文本数据;第一分词处理单元,用于对所述书面语文本数据进行分词及向量化处理,得到每句书面语文本数据的词向量序列;第一训练单元,用于根据所述词向量序列及对应的目标文本数据训练模型参数,在训练过程中依次将每句源文本数据的词向量序列输入所述编码网络,利用所述解码网络输出的目标文本序列与所述源文本数据对应的目标文本数据之间的差值对模型参数进行更新;并在训练结束后,得到模型参数。优选地,所述系统还包括:词序调整模块,用于在所述目标文本数据中插入副语言信息之前,确定所述目标文本数据是否需要进行词序调整;如果需要,则对所述目标文本数据进行词序调整。优选地,所述词序调整模块包括:计算单元,用于计算所述目标文本数据的语言模型得分;判断单元,用于在所述语言模型得分低于设定阈值时,根据预先构建的词序调整判断模型依次判断所述目标文本数据中相邻词的词序是否需要调整;调整单元,用于在所述判断单元判断所述目标文本数据中相邻词的词序需要调整时,对所述目标文本数据进行词序调整。优选地,所述判断单元,具体用于依次将所述目标文本数据中的各词作为当前待判定词,将所述当前待判断词及其上下文信息输入所述词序调整判断模型,根据所述词序调整判断模型的输出确定是否对当前待判断词及其相邻词的词序进行调整。优选地,所述待判定词的上下文信息包括以下任意一项或多项:所述待判断词的前、后一个或多个词,所述待判断词所属句子的语义信息,所述待判断词所属句子的语言模型得分。优选地,所述信息插入模块包括:位置预测单元,用于将所述目标文本数据的词本文档来自技高网...
将书面文本转换为口语文本的方法及系统

【技术保护点】
一种将书面文本转换为口语文本的方法,其特征在于,所述方法包括:接收待转换的源文本数据;对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;依次将每句源文本数据的词向量序列输入预先构建的文本转换模型,根据所述文本转换模型的输出得到所述源文本数据对应的目标文本数据;在所述目标文本数据中插入副语言信息,得到带有副语言信息的口语化文本数据。

【技术特征摘要】
1.一种将书面文本转换为口语文本的方法,其特征在于,所述方法包括:接收待转换的源文本数据;对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;依次将每句源文本数据的词向量序列输入预先构建的文本转换模型,根据所述文本转换模型的输出得到所述源文本数据对应的目标文本数据;在所述目标文本数据中插入副语言信息,得到带有副语言信息的口语化文本数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述文本转换模型的构建过程包括:确定文本转换模型的拓扑结构,所述拓扑结构包括编码网络和解码网络,所述编码网络的输入为词向量序列、输出为词编码向量;所述解码网络的输入为所述编码网络输出的词编码向量及当前待转换词之前的历史词向量、输出为目标文本序列;收集大量文本数据,所述文本数据包括书面语文本数据及与其对应的口语化文本数据;对所述书面语文本数据进行分词及向量化处理,得到每句书面语文本数据的词向量序列;根据所述词向量序列及对应的目标文本数据训练模型参数,在训练过程中依次将每句源文本数据的词向量序列输入所述编码网络,利用所述解码网络输出的目标文本序列与所述源文本数据对应的目标文本数据之间的差值对模型参数进行更新;并在训练结束后,得到模型参数。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述目标文本数据中插入副语言信息之前,确定所述目标文本数据是否需要进行词序调整;如果需要,则对所述目标文本数据进行词序调整。4.根据权利要求3所述的方法,其特征在于,所述确定所述目标文本数据是否需要进行词序调整包括:计算所述目标文本数据的语言模型得分;如果所述得分低于设定阈值,则根据预先构建的词序调整判断模型依次判断所述目标文本数据中相邻词的词序是否需要调整。5.根据权利要求4所述的方法,其特征在于,所述根据预先构建的词序调整判断模型依次判断所述目标文本数据中相邻词的词序是否需要调整包括:依次将所述目标文本数据中的各词作为当前待判定词,将所述当前待判断词及其上下文信息输入所述词序调整判断模型,根据所述词序调整判断模型的输出确定是否对当前待判断词及其相邻词的词序进行调整。6.根据权利要求5所述的方法,其特征在于,所述待判定词的上下文信息包括以下任意一项或多项:所述待判断词的前、后一个或多个词,所述待判断词所属句子的语义信息,所述待判断词所属句子的语言模型得分。7.根据权利要求1至6任一项所述的方法,其特征在于,所述在所述目标文本数据中插入副语言信息包括:将所述目标文本数据的词序列输入预先构建的位置预测模型,根据所述位置预测模型的输出确定每种副语言信息的插入位置;在每种副语言信息的插入位置插入对应的副语言信息。8.根据权利要求7所述的方法,其特征在于,所述位置预测模型的输出为:副语言信息的类型和位置,或者副语言信息的位置。9.根据权利要求7所述的方法,其特征在于,所述位置预测模型的构建过程包括:确定位置预测模型的拓扑结构;收集大量文本数据,所述文本数据包括:不带副语言信息的文本数据及与其对应的带副语言信息的文本数据;对所述不带副语言信息的文本数据进行分词及向量化处理,得到每句不带副语言信息的文本数据的词向量序列;根据所述词向量序列及对应的带副语言信息的文本数据训练模型参数,在训练过程中,以每种副语言信息的预测插入位置与对应的带副语言信息的文本数据中所述副语言信息的实际位置的差值最小化为目标,对模型参数进行更新;并在训练结束后,得到模型参数。10.一种将书面文本转换为口语文本的系统,其特征在于,所述系统包括:接收模块,用于接收待转换的源文本数据;分词处理模块,用于对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;文本转换模块,用于依次将每句源...

【专利技术属性】
技术研发人员:周明江源胡国平胡郁
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1