文本识别方法、文本识别装置以及可读存储介质制造方法及图纸

技术编号:37638986 阅读:17 留言:0更新日期:2023-05-25 10:06
本申请提供一种文本识别方法、文本识别装置以及计算机可读存储介质。该文本识别方法包括:获取待识别文本的嵌入层表示;基于嵌入层表示分别提取待识别文本的槽位语义表示和意图语义表示;将槽位语义表示和意图语义表示输入输出层,获取待识别文本的槽位标签和意图标签;根据槽位标签和意图标签获取待识别文本的文本信息。通过上述方式,文本识别装置采用多模型结合的方式训练联合检测模型,通过不同模型之间的关系可以一次性识别话术意图和话术槽位,节省计算资源,提升推理速度以及联合模型的整体性能。型的整体性能。型的整体性能。

【技术实现步骤摘要】
文本识别方法、文本识别装置以及可读存储介质


[0001]本申请涉及自然语言处理
,特别是涉及一种文本识别方法、文本识别装置以及计算机可读存储介质。

技术介绍

[0002]自然语言处理(NLP,Natural Language Processing)是计算机科学领域与人工智能领域的一个重要分支。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,从而使计算机能够像人类一样理解、处理和生成语言。
[0003]自然语言理解(NLU,Natural Language Understanding)是自然语言处理领域中的一个重要课题,其中意图识别和槽位填充是NLU最关键的两个任务。意图识别任务侧重于基于用户输入信息预测用户意图;槽位填充任务侧重于提取用户输入信息中的语义概念作为自然语言的约束,简单来说就是为输入信息中每个单词分配语义标签。例如,在智能客服对话系统中,通过完成对用户输入信息的意图识别任务和槽位填充任务,可以生成相应的对话策略,但传统的意图识别和槽位填充需要分开通过两个模型来完成。两次识别一方面不能很好的利用话术的语本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述文本识别方法包括:获取待识别文本的嵌入层表示;基于所述嵌入层表示分别提取所述待识别文本的槽位语义表示和意图语义表示;将所述槽位语义表示和所述意图语义表示输入输出层,获取所述待识别文本的槽位标签和意图标签;根据所述槽位标签和所述意图标签获取所述待识别文本的文本信息。2.根据权利要求1所述的文本识别方法,其特征在于,所述基于所述嵌入层表示分别提取所述待识别文本的槽位语义表示和意图语义表示,包括:利用文本识别模型中的第一神经网络模型从所述嵌入层表示提取所述待识别文本的槽位语义表示;利用所述文本识别模型中的第二神经网络模型从所述嵌入层表示提取所述待识别文本的意图语义表示。3.根据权利要求1所述的文本识别方法,其特征在于,所述基于所述嵌入层表示分别提取所述待识别文本的槽位语义表示和意图语义表示,包括:利用所述文本识别模型中的神经网络模型从所述嵌入层表示提取所述待识别文本的槽位语义表示以及中间意图语义表示;对所述中间意图语义表示进行降维处理,获取所述待识别文本的意图语义表示。4.根据权利要求1至3任一项所述的文本识别方法,其特征在于,所述文本识别方法,还包括:利用槽位门控模块融合所述意图语义表示,以及若干字词的槽位语义表示,获取所述槽位语义表示的注意力权重;将所述槽位语义表示及其注意力权重输入所述输出层,获取所述待识别文本的槽位标签。5.根据权利要求1至3任一项所述的文本识别方法,其特征在于,所述文本识别模型中的神经网络模型为卷积神经网络、循环神经网络和/或预训练模型。6.根据权利要求1所述的文本识别方法,其特征在于,所述文本识别方法,还包括:利用注意力模块对所述嵌入层表示进行处理;和/或,利用注意力模块对神经网络模型输出的中间槽位语义表示,和/或中间意图语义表示进行处理。7.根据权利要求...

【专利技术属性】
技术研发人员:陈瑶林聚财沈芳婷殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1