【技术实现步骤摘要】
一种停顿识别方法、装置、设备及存储介质
[0001]本申请实施例涉及数据处理
,尤其涉及一种停顿识别方法、装置、设备及存储介质。
技术介绍
[0002]语音合成技术是一种将文字转化为语音的技术,通常需要先判断输入的语种,再根据对应语种的语法法则,对文本做切分。
[0003]在现有技术中,对文本的切分方式通常采用人为手段进行切分,人为切分方式的效率较低,且人为主观意识较强,受人为主观意识影响,文本切分的结果通常也不同,最终会影响切分结果的准确度。
技术实现思路
[0004]本申请提供一种停顿识别方法、装置、设备及存储介质,以实现自动化的对文本进行停顿识别,提高停顿识别的准确性,以及提高停顿位置的确定效率。
[0005]第一方面,本申请实施例提供了一种停顿识别方法,该方法包括:
[0006]识别待处理文本中的成分片语和各所述成分片语的成分类别;
[0007]对所述待处理文本进行分词,得到至少一个拆分词组;
[0008]根据各所述拆分词组在所述待处理文本中的词序,生成词 ...
【技术保护点】
【技术特征摘要】
1.一种停顿识别方法,其特征在于,包括:识别待处理文本中的成分片语和各所述成分片语的成分类别;对所述待处理文本进行分词,得到至少一个拆分词组;根据各所述拆分词组在所述待处理文本中的词序,生成词组序列;根据所述词组序列中各拆分词组所属成分片语和对应成本类别,确定所述待处理文本的停顿位置。2.根据权利要求1所述的方法,其特征在于,所述根据所述词组序列中各拆分词组所属成分片语和对应成本类别,确定所述待处理文本的停顿位置,包括:根据各所述拆分词组的词性、各所述拆分词组所属成分片语的成分类别、以及各所述拆分词组的词序,构建句法树;其中,所述句法树中的根节点为句子,子节点为成分类别,叶子节点为词性;根据所述句法树,确定所述待处理文本的停顿位置。3.根据权利要求2所述方法,其特征在于,所述根据句法树,确定所述待处理文本的停顿位置,包括:根据所述句法树中各节点对应拆分词组的字符数量,确定所述待处理文本的停顿位置。4.根据权利要求3所述的方法,其特征在于,所述根据所述句法树中各节点对应拆分词组的字符数量,确定所述待处理文本的停顿位置,包括:确定所述待处理文本中各所述成分片语之间的位置为停顿位置;将字符数量大于预设数量阈值的成分片语在所述句法树中的子节点作为目标子节点;将所述目标子节点的叶子节点对应拆分词组作为目标词组,并将所述待处理文本的目标词组之间的位置作为停顿位置。5.根据权利要求1所述的方法,其特征在于,所述识别待处理文本中...
【专利技术属性】
技术研发人员:叶万余,钟业荣,阮国恒,江嘉铭,阮伟聪,黄小强,戴争干,陈少敏,劳文超,
申请(专利权)人:广东电网有限责任公司清远供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。