一种文本修正方法、装置、设备及存储介质制造方法及图纸

技术编号：41133276 阅读：13 留言：0更新日期：2024-04-30 18:03

本申请实施例提供了一种文本修正方法、装置、设备及存储介质。其中，一种文本修正方法，包括:获取对目标语音进行文本转换所得到的文本，作为目标文本；获取所述目标文本对应的上文文本；判断所述目标文本的字数是否大于预设阈值；根据所述目标文本的字数确定对所述目标文本的修正策略。可见，本方案可以对利用用户的语音转换成的文本数据进行修正，得到更加贴合用户实际表达内容的文本数据。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及机器识别，特别是涉及一种文本修正方法、装置、设备及存储介质。

技术介绍

1、智能客服应用范围广泛，可以为用户提供服务，在提升了工作效率的同时，为公司降本增效。而智能客服在应用时需要理解并明确用户的意图，继而进行个性化服务，可见精准理解用户所表达的意图是十分关键的。

2、在用户与智能客服交互过程中，智能客服需要将用户的语音转换成对应的文本数据，从而基于文本数据进行意图识别。但是，由于语音转换的技术原因以及其它因素，例如用户发音不标准以及环境噪音的影响，导致转换得到的文本数据不准确，从而导致后续对用户意图理解出现偏差。并且，用户与智能客服交互过程中，用户通常倾向于简短并且口语化的表达，因此用户表述中存在着大量信息省略和指代问题，这会导致仅仅基于转换得到的文本数据，智能客服无法确定用户表达的意图。

3、因此，为了更加精准的理解用户所表达的意图，如何对利用用户的语音转换成的文本数据进行修正，得到更加贴合用户实际表达内容的文本数据成为亟需解决的问题。

技术实现思路

...

【技术保护点】

1.一种文本修正方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述文本补全模型包括编码器和解码器，所述文本补全模型的训练过程包括：

3.根据权利要求1或2所述的方法，其特征在于，对所述目标文本和第二文本中的任一待纠正文本进行文本纠正处理的过程由预设的检测器和纠正器进行实现；

4.根据权利要求3所述的方法，其特征在于，所述检测器中包含有第一双向语言模型BERT模型、第二BERT模型以及第一归一化指数softmax层；

5.根据权利要求2所述的方法，其特征在于，所述待进行文本补全的样本文本的获取方式包括：

6....

【技术特征摘要】

1.一种文本修正方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述文本补全模型包括编码器和解码器，所述文本补全模型的训练过程包括：

4.根据权利要求3所述的方法，其特征在于，所述检测器中包含有第一双向语言模型bert模型、第二bert模型以及第一归一化指数softmax层；

5.根据权利要求2所述的方法，其特征在于，所述待进行文本补全的样本文本的获取方式包括：

6....

【专利技术属性】
技术研发人员：孙冰，潘建东，刘国杨，
申请(专利权)人：中信建投证券股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人