【技术实现步骤摘要】
文本处理方法、装置以及计算机设备
本申请实施例涉及云技术及人工智能
,特别是涉及一种文本处理方法、装置以及计算机设备。
技术介绍
人工智能(ArtificialIntelligence,AI)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,可使机器具有感知、推理与决策的功能。随着人工智能技术的快速发展,基于自然语言处理技术的文本韵律识别功能在文本分析领域所占的比重越来越大。文本韵律识别是人工智能技术的一个重要应用领域,主要用于对用户输入的文本进行韵律识别,通过识别出文本中的正确韵律,为用户提供韵律指导。目前的文本处理方式,通常是对文本中的重音或停顿分别进行检测,但在检测过程中不仅没有考虑重音词与非重音词之间的区别,也没有考虑文本停顿处不同词之间的区别,导致文本韵律识别准确率较低。
技术实现思路
本申请实施例提供一种文本处理方法、装置以及计算机设备,用以提高文本韵律识别准确率。为解决上述技术问题,本申请实施例提供以下技术方案:第一方面,本申请实施例提供一种文本处理方法,所述方法包括:接收待标注文本,所述待标注文本中包括至少两个单词;根据所述待标注文本中各单词的文本特征,获取各单词的第一单词特征;获取两个相邻单词的所述第一单词特征之间的距离特征,并基于所述距离特征对各单词的第一单词特征进行处理,得到各单词的第二单词特征;根据所述第二单词特征,获取所述待标注文本的韵律识别结果,所述韵律识别结果包括停顿位置和重读位 ...
【技术保护点】
1.一种文本处理方法,其特征在于,所述方法包括:/n接收待标注文本,所述待标注文本中包括至少两个单词;/n根据所述待标注文本中各单词的文本特征,获取各单词的第一单词特征;/n获取两个相邻单词的所述第一单词特征之间的距离特征,并基于所述距离特征对各单词的第一单词特征进行处理,得到各单词的第二单词特征;/n根据所述第二单词特征,获取所述待标注文本的韵律识别结果,所述韵律识别结果包括停顿位置和重读位置。/n
【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法包括:
接收待标注文本,所述待标注文本中包括至少两个单词;
根据所述待标注文本中各单词的文本特征,获取各单词的第一单词特征;
获取两个相邻单词的所述第一单词特征之间的距离特征,并基于所述距离特征对各单词的第一单词特征进行处理,得到各单词的第二单词特征;
根据所述第二单词特征,获取所述待标注文本的韵律识别结果,所述韵律识别结果包括停顿位置和重读位置。
2.根据权利要求1所述的文本处理方法,其特征在于,所述获取两个相邻单词的所述第一单词特征之间的距离特征,并基于所述距离特征对各单词的第一单词特征进行处理,得到各单词的第二单词特征的步骤,包括:
根据所述待标注文本中各单词的相邻关系,获取两个相邻单词的所述第一单词特征之间的距离特征;
基于所述距离特征,对各单词的第一单词特征进行拼接处理,得到各单词的第二单词特征。
3.根据权利要求2所述的文本处理方法,其特征在于,所述根据所述待标注文本中各单词的相邻关系,获取两个相邻单词的所述第一单词特征之间的距离特征的步骤,包括:
根据所述待标注文本中各单词的相邻关系,确定所述待标注文本中相邻的第一单词和第二单词,其中,所述第一单词的第一单词特征与所述第二单词的第一单词特征之差为所述距离特征;
当所述待标注文本中的末位单词为所述第一单词时,计算所述末位单词的第一单词特征与预设有效特征之间的距离,作为所述距离特征;
当所述待标注文本中的末位单词为所述第二单词时,计算目标第一单词的第一单词特征与所述末位单词的第一单词特征之间的距离,作为所述距离特征,所述目标第一单词为与所述末位单词相邻的单词。
4.根据权利要求2所述的文本处理方法,其特征在于,所述基于所述距离特征,对各单词的第一单词特征进行拼接处理,得到各单词的第二单词特征的步骤,包括:
确定所述距离特征对应的第一单词和第二单词,其中,所述第一单词的第一单词特征与所述第二单词的第一单词特征之差为所述距离特征;
将所述距离特征与所述第一单词的第一单词特征进行拼接处理,得到拼接后的第一单词特征;
确定各单词所述拼接后的第一单词特征,作为所述第二单词特征。
5.根据权利要求1所述的文本处理方法,其特征在于,所述根据所述待标注文本中各单词的文本特征,获取各单词的第一单词特征的步骤,包括:
对所述待标注文本进行分词处理,得到至少两个单词;
提取所述至少两个单词中各单词的文本特征,并基于预存...
【专利技术属性】
技术研发人员:林炳怀,王丽园,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。