文本标注方法、设备和存储介质技术

技术编号:43639499 阅读:22 留言:0更新日期:2024-12-13 12:38
本申请公开了一种文本标注方法、设备和存储介质,涉及电数据处理技术领域,公开了文本标注方法,包括:确定语音练习的当前语言场景的场景信息;在接收到用户的预设操作信息时,获取用户输入的目标语音,生成所述目标语音对应的目标文本;根据所述场景信息对应的参考语音和/或参考文本,生成所述目标文本的标注信息。本申请通过确定语音练习的场景信息,并通过场景信息的参考语音和/或参考文本对目标语音的文本进行标注,由于根据不同场景对语音进行识别并标注,使得标注后的语音文本更加贴合当前的语言环境,提高文本标注的准确率。

【技术实现步骤摘要】

本申请涉及电数据处理,尤其涉及一种文本标注方法、设备和存储介质


技术介绍

1、文本纠错可应用于较多场景。例如,语音训练场景,通过用户录入语音,生成语音对应的纠错信息。由于语言的多样性,在不同的地域,单词语法和发音等均不同,没有统一的标准。现有方案通过对文本进行分词,分别对各分词进行识别,无法根据应用对象的不同对单词语法和发音进行纠错,需要进行人工核对,导致语音纠错的准确度较低。


技术实现思路

1、本申请的主要目的在于提供一种文本标注方法、设备和存储介质,旨在解决无法根据应用对象的不同对单词语法和发音进行纠错,需要进行人工核对,导致语音纠错的准确度较低的技术问题。

2、为实现上述目的,本申请提出一种文本标注方法,所述的方法包括:

3、确定语音练习的当前语言场景的场景信息;

4、在接收到用户的预设操作信息时,获取用户输入的目标语音,生成所述目标语音对应的目标文本;

5、根据所述场景信息对应的参考语音和/或参考文本,生成所述目标文本的标注信息。</p>

6、在一本文档来自技高网...

【技术保护点】

1.一种文本标注方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述确定语音练习的当前语言场景的场景信息的步骤包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述场景信息对应的参考语音和/或参考文本,生成所述目标文本的标注信息的步骤包括:

4.如权利要求3所述的方法,其特征在于,所述根据所述场景信息的参考文本和所述上下文信息,生成所述目标文本的标注信息包括单词的纠错内容的步骤包括:

5.如权利要求1所述的方法,其特征在于,所述确定语音练习的当前语言场景的场景信息的步骤包括:

6.如权利要求1所述...

【技术特征摘要】

1.一种文本标注方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述确定语音练习的当前语言场景的场景信息的步骤包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述场景信息对应的参考语音和/或参考文本,生成所述目标文本的标注信息的步骤包括:

4.如权利要求3所述的方法,其特征在于,所述根据所述场景信息的参考文本和所述上下文信息,生成所述目标文本的标注信息包括单词的纠错内容的步骤包括:

5.如权利要求1所述的方法,其特征在于,所述确定语音练习的当前语言场景的场景信息的步骤包括:

6.如权利要求1所述的方法,其特征在于,所述确定语音练习的当前语言场景的场景信息的步骤包括...

【专利技术属性】
技术研发人员:杨煜荣苏子旭
申请(专利权)人:广州学晟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1