文本标注方法、设备和存储介质技术

技术编号：43639499 阅读：22 留言：0更新日期：2024-12-13 12:38

本申请公开了一种文本标注方法、设备和存储介质，涉及电数据处理技术领域，公开了文本标注方法，包括：确定语音练习的当前语言场景的场景信息；在接收到用户的预设操作信息时，获取用户输入的目标语音，生成所述目标语音对应的目标文本；根据所述场景信息对应的参考语音和/或参考文本，生成所述目标文本的标注信息。本申请通过确定语音练习的场景信息，并通过场景信息的参考语音和/或参考文本对目标语音的文本进行标注，由于根据不同场景对语音进行识别并标注，使得标注后的语音文本更加贴合当前的语言环境，提高文本标注的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及电数据处理，尤其涉及一种文本标注方法、设备和存储介质。

技术介绍

1、文本纠错可应用于较多场景。例如，语音训练场景，通过用户录入语音，生成语音对应的纠错信息。由于语言的多样性，在不同的地域，单词语法和发音等均不同，没有统一的标准。现有方案通过对文本进行分词，分别对各分词进行识别，无法根据应用对象的不同对单词语法和发音进行纠错，需要进行人工核对，导致语音纠错的准确度较低。

技术实现思路

1、本申请的主要目的在于提供一种文本标注方法、设备和存储介质，旨在解决无法根据应用对象的不同对单词语法和发音进行纠错，需要进行人工核对，导致语音纠错的准确度较低的技术问题。

2、为实现上述目的，本申请提出一种文本标注方法，所述的方法包括：

3、确定语音练习的当前语言场景的场景信息；

4、在接收到用户的预设操作信息时，获取用户输入的目标语音，生成所述目标语音对应的目标文本；

5、根据所述场景信息对应的参考语音和/或参考文本，生成所述目标文本的标注信息。</p>

6、在一本文档来自技高网...

【技术保护点】

1.一种文本标注方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述确定语音练习的当前语言场景的场景信息的步骤包括：

3.如权利要求1所述的方法，其特征在于，所述根据所述场景信息对应的参考语音和/或参考文本，生成所述目标文本的标注信息的步骤包括：

4.如权利要求3所述的方法，其特征在于，所述根据所述场景信息的参考文本和所述上下文信息，生成所述目标文本的标注信息包括单词的纠错内容的步骤包括：

5.如权利要求1所述的方法，其特征在于，所述确定语音练习的当前语言场景的场景信息的步骤包括：

6.如权利要求1所述...

【技术特征摘要】

1.一种文本标注方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述确定语音练习的当前语言场景的场景信息的步骤包括：

3.如权利要求1所述的方法，其特征在于，所述根据所述场景信息对应的参考语音和/或参考文本，生成所述目标文本的标注信息的步骤包括：

5.如权利要求1所述的方法，其特征在于，所述确定语音练习的当前语言场景的场景信息的步骤包括：

6.如权利要求1所述的方法，其特征在于，所述确定语音练习的当前语言场景的场景信息的步骤包括...

【专利技术属性】
技术研发人员：杨煜荣，苏子旭，
申请(专利权)人：广州学晟科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人