一种对中文韵律结构进行预测的方法及其相关设备技术

技术编号：35293108 阅读：22 留言：0更新日期：2022-10-22 12:39

本申请实施例属于人工智能领域，应用于中文韵律结构预测领域中，涉及一种对中文韵律结构进行预测的方法，包括获取输入文本；基于预训练中文BERT获取输入文本的特征序列；基于特征序列和预设多头注意力分类器对输入文本中各汉字进行韵律停顿分类，获取分类后的输出文本；基于输出文本、特征序列和预设韵律结构类别预测输入文本的中文韵律结构。本申请还提供一种对中文韵律结构进行预测的装置、计算机设备及存储介质。本申请相较于传统方法，使用中文BERT避免了复杂且精细的文本特征设计过程，且便于迁移至其它场景，节省了高昂的特征设计成本和韵律数据标注成本，同时，使用多头注意力分类器能更有效地利用上下文信息，分类准确度更高。度更高。度更高。

全部详细技术资料下载

【技术实现步骤摘要】
一种对中文韵律结构进行预测的方法及其相关设备

[0001]本申请涉及人工智能和中文韵律结构预测
，尤其涉及一种对中文韵律结构进行预测的方法及其相关设备。

技术介绍

[0002]标准中文前端模块至少包含韵律结构预测和字音转换两大功能，韵律结构预测主要用于获取合成文本的上下文相关韵律信息，准确的韵律结构预测对合成语音的节奏感和真实感起到关键作用，根据语音学知识，中文韵律特征具有层级结构，韵律结构预测主要预测韵律词、韵律短语和语调短语这三层结构。
[0003]现有中文韵律预测主要采用语法树规则法、条件随机场和神经网络等方法，这些方法均需要专业人士针对适用场景进行复杂且精细的特征设计，但预测效果欠佳，同时缺乏普适性，难以在不同适用场景间进行迁移。

技术实现思路

[0004]本申请实施例的目的在于提出一种对中文韵律结构进行预测的方法、装置、计算机设备及存储介质，以解决现有技术在进行中文韵律结构预测时，均需要专业人士针对适用场景进行复杂且精细的特征设计，预测效果欠佳，同时缺乏普适性，难以在不同适用场景间进行迁移的问题。
[0005]为了解决上述技术问题，本申请实施例提供一种对中文韵律结构进行预测的方法，采用了如下所述的技术方案：
[0006]一种对中文韵律结构进行预测的方法，包括下述步骤：
[0007]获取输入文本；
[0008]基于预训练中文BERT获取所述输入文本的特征序列；
[0009]基于所述特征序列和预设多头注意力分类器对所述输入文本中各汉字进行韵律...

【技术保护点】

【技术特征摘要】
1.一种对中文韵律结构进行预测的方法，其特征在于，包括下述步骤：获取输入文本；基于预训练中文BERT获取所述输入文本的特征序列；基于所述特征序列和预设多头注意力分类器对所述输入文本中各汉字进行韵律停顿分类，获取分类后的输出文本；基于所述输出文本、特征序列和预设韵律结构类别预测所述输入文本的中文韵律结构。2.根据权利要求1所述的对中文韵律结构进行预测的方法，其特征在于，在所述基于预训练中文BERT获取所述输入文本的特征序列步骤之前，还包括：识别所述输入文本的构成类型；若所述输入文本仅包含单个汉语句，则获取该汉语句中各汉字的词向量和位置向量，将所述词向量和位置向量作为所述特征序列；若所述输入文本包含多个汉语句，则获取该输入文本中各汉语句的句子向量、各汉语句中各汉字的词向量和位置向量，将所述句子向量、词向量和位置向量作为所述特征序列。3.根据权利要求2所述的对中文韵律结构进行预测的方法，其特征在于，所述预设多头注意力分类器包括多头注意力层和一维卷积层，所述基于所述特征序列和预设多头注意力分类器对所述输入文本中各汉字进行韵律停顿分类的步骤，具体包括：预先基于所述韵律停顿分类类别，对不同韵律停顿分类进行第一区别命名；将所述特征序列中词向量作为查询值，将不同韵律停顿分类对应参照字集中各汉字的词向量作为键值和属性值，分别基于预设的不同参数对所述查询值、键值和属性值进行第一线性转换；获取经第一线性转换后所述查询值对应的线性序列、所述键值对应的线性序列和所述属性值对应的线性序列；将所述查询值对应的线性序列、所述键值对应的线性序列和所述属性值对应的线性序列作为参数，通过注意力层的Attention(Q,K,V)函数，分别获取所述输入文本中各汉字的词向量在不同注意力层获取的特征向量，其中，Q表示所述查询值对应的线性序列，K表示所述键值对应的线性序列，V表示所述属性值对应的线性序列；通过所述多头注意力层分别计算所述输入文本中各汉字的特征向量与不同韵律停顿分类中各参照字的词向量间的向量点积，对预设不同韵律停顿分类对应的向量点积进行拼接，获取拼接结果；通过所述一维卷积层对所述拼接结果进行第二线性转换，获取拼接之后向量点积对应的线性序列，作为输出线性序列；基于所述第一区别命名和所述输出线性序列中各向量点积，识别出所述输入文本中各汉字分别对应的韵律停顿分类。4.根据权利要求3所述的对中文韵律结构进行预测的方法，其特征在于，在所述对不同韵律停顿分类进行第一区别命名步骤之前，还包括：基于所述中文BERT获取已完成中文韵律结构预测的批量汉语句中各汉字和所述各汉字的词向量；将所述批量汉语句中各汉字作为数据源，基于韵律停顿分类对所述数据源进行预分
类，获取不同韵律停顿分类对应的参照字集，其中，在进行所述预分类时，同时将所述各汉字作为标签名称，将其对应词向量作为属性值，进行键对值构建。5.根据权利要求3所述的对中文韵律结构进行预测的方法，其特征在于，在所述一维卷积层对所述拼接结果进行第二线性转换步骤之后，还包括：基于sigmoid激活函数对所述输出线性序列中各向量点积进行数值压缩，将其压缩至取值范围为区间[0...

【专利技术属性】
技术研发人员：郭洋，王健宗，程宁，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人