【技术实现步骤摘要】
本申请涉及机器识别,特别是涉及一种文本修正方法、装置、设备及存储介质。
技术介绍
1、智能客服应用范围广泛,可以为用户提供服务,在提升了工作效率的同时,为公司降本增效。而智能客服在应用时需要理解并明确用户的意图,继而进行个性化服务,可见精准理解用户所表达的意图是十分关键的。
2、在用户与智能客服交互过程中,智能客服需要将用户的语音转换成对应的文本数据,从而基于文本数据进行意图识别。但是,由于语音转换的技术原因以及其它因素,例如用户发音不标准以及环境噪音的影响,导致转换得到的文本数据不准确,从而导致后续对用户意图理解出现偏差。并且,用户与智能客服交互过程中,用户通常倾向于简短并且口语化的表达,因此用户表述中存在着大量信息省略和指代问题,这会导致仅仅基于转换得到的文本数据,智能客服无法确定用户表达的意图。
3、因此,为了更加精准的理解用户所表达的意图,如何对利用用户的语音转换成的文本数据进行修正,得到更加贴合用户实际表达内容的文本数据成为亟需解决的问题。
技术实现思路
...
【技术保护点】
1.一种文本修正方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述文本补全模型包括编码器和解码器,所述文本补全模型的训练过程包括:
3.根据权利要求1或2所述的方法,其特征在于,对所述目标文本和第二文本中的任一待纠正文本进行文本纠正处理的过程由预设的检测器和纠正器进行实现;
4.根据权利要求3所述的方法,其特征在于,所述检测器中包含有第一双向语言模型BERT模型、第二BERT模型以及第一归一化指数softmax层;
5.根据权利要求2所述的方法,其特征在于,所述待进行文本补全的样本文本的获取方式包括
6....
【技术特征摘要】
1.一种文本修正方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述文本补全模型包括编码器和解码器,所述文本补全模型的训练过程包括:
3.根据权利要求1或2所述的方法,其特征在于,对所述目标文本和第二文本中的任一待纠正文本进行文本纠正处理的过程由预设的检测器和纠正器进行实现;
4.根据权利要求3所述的方法,其特征在于,所述检测器中包含有第一双向语言模型bert模型、第二bert模型以及第一归一化指数softmax层;
5.根据权利要求2所述的方法,其特征在于,所述待进行文本补全的样本文本的获取方式包括:
6....
【专利技术属性】
技术研发人员:孙冰,潘建东,刘国杨,
申请(专利权)人:中信建投证券股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。