The invention belongs to the field of speech synthesis, in particular to a Chinese prosodic structure prediction method which fuses syntactic, semantic and pragmatic information. The purpose is to fuse the syntactic and semantic pragmatic information into the prosodic structure prediction model by analyzing the multi-dimensional features and their related modes of action, so as to enhance the naturalness of speech synthesis. This method includes sentence block division according to semantic role tagging, sentence block grammatical analysis, and marked grammatical structural looseness, preliminary segmentation of prosodic structure, tagging of information structure of nominal components in sentences, tagging of pragmatic information, and preliminary segmentation of prosodic according to pragmatic information. The structure is adjusted. In the text annotation system, the deep syntax, semantic role annotation and pragmatic information are introduced, and text annotation, feature extraction and prosody structure prediction are realized by combining statistics with rules, so that the accuracy of prosody prediction model is effectively improved.
【技术实现步骤摘要】
一种融合句法语义语用信息的汉语韵律结构预测方法
本专利技术属于语音合成领域,具体涉及一种融合句法语义语用信息的汉语韵律结构预测方法。
技术介绍
从文本信息中预测韵律层级结构是语音合成的关键,对于提升合成语音的自然度与表现力、构建智能人机对话系统具有重要作用。韵律层级预测至今还有许多问题没有得到很好解决。首先,对于影响韵律结构的文本特征以及因素之间关系的描述不够确切,其次,单一模型的准确度难以达到理想状态。从汉语韵律结构预测的现有研究来看,关于韵律建模方法的技术研究较多,而关于影响韵律结构的因素以及因素之间关系的研究较少。目前韵律结构的预测主要有基于规则的方法、基于统计机器学习的方法、规则和统计相结合的方法。从所使用的信息源来看,多为语句中的词性、词长信息以及浅层语法信息,较少利用深层语法和语义信息。专利CN104867490B将词向量的聚类特征加入从标注数据提取的特征集合之中,专利CN104867491B基于同义词词林对训练语料文本中的分词进行泛化,引入语义信息后提升了模型预测准确性。然而这些语义分析都是以词为单位的,对韵律结构的作用有限,没有将更高层次的句法组块的语义角色考虑进来,也没有分析语用因素。语言学研究发现普通话韵律边界和韵律模式是句法、语义、语用综合作用的结果。基于语义角色的句法组块的分类影响韵律结构的层级,而韵律边界处的语用信息和长度信息则影响韵律成分跨界与否。因此在韵律结构预测过程中需要引入更多句法语义和语用相关的信息,使模型准确性得到提升。
技术实现思路
本专利技术提供一种融合句法语义语用信息的汉语韵律结构预测方法。除了利用传统预测线索之外, ...
【技术保护点】
1.一种融合句法语义语用信息的汉语韵律结构预测方法,包括如下步骤:步骤一、对已经分词和词性标注的文本进行语义角色的句块划分;步骤二、对句块进行语法分析,并对语法结构关系松紧度进行标记;步骤三、根据句块以及句块的语法结构关系对韵律结构进行初步切分;步骤四、对句子中的名词性成分的信息结构进行标记;步骤五、根据语法结构、初步划分的韵律结构以及信息结构进行语用信息的标注;步骤六、根据语用信息对初步切分的韵律结构进行调整。
【技术特征摘要】
1.一种融合句法语义语用信息的汉语韵律结构预测方法,包括如下步骤:步骤一、对已经分词和词性标注的文本进行语义角色的句块划分;步骤二、对句块进行语法分析,并对语法结构关系松紧度进行标记;步骤三、根据句块以及句块的语法结构关系对韵律结构进行初步切分;步骤四、对句子中的名词性成分的信息结构进行标记;步骤五、根据语法结构、初步划分的韵律结构以及信息结构进行语用信息的标注;步骤六、根据语用信息对初步切分的韵律结构进行调整。2.如权利要求1所述的一种融合句法语义语用信息的汉语韵律结构预测方法,其特征在于:步骤一中,所述语义角色指谓语根据其与相关的名词短语之间的语义关系而指派给这些名词短语的角色;所述名词短语语义角色包括核心语义角色和附加语义角色,义角色的句块划分依据CPB语料库运用统计方法实现。3.如权利要求1所述的一种融合句法语义语用信息的汉语韵律结构预测方法,其特征在于:步骤二中,所述语法结构关系松紧度包括黏合类、组合类、等立类;松紧度根据语法结构形式判定,语法结构形式根据统计建模句法分析得到。4.如权利要求1所述的一种融合句法语义语用信息的汉语韵律结构预测方法,其特征在于:步骤三中对韵律结构进行初步划分的规则包括:跨界规则:如果前一韵律单位中只有一个音步,且本韵律单位除可跨界音步外大于等于两个音步,则可跨界音步与前一音步合并;韵律单位归并规则:如果本韵律单位中只有一个音步且后续同级单位中也只有一个音步,则本单位与后续同级单位合...
【专利技术属性】
技术研发人员:高懿,季竞,张志平,陈博,
申请(专利权)人:北京灵伴即时智能科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。