一种信息处理方法、装置、设备和计算机存储介质制造方法及图纸

技术编号:30515211 阅读:27 留言:0更新日期:2021-10-27 22:57
本发明专利技术公开了一种信息处理方法、装置、设备和计算机存储介质,方法包括:获取第一输入信息,其中第一输入信息包含非规范性语言;基于第一输入信息,生成第二输入信息,其中第二输入信息修正了非规范性语言;将所生成的第二输入信息作为深度学习模型的输入进行训练,生成第一输出信息,其中第一输出信息包含第一输入信息中特定领域词汇的标签信息;基于第一输出信息,生成第二输出信息,其中第二输入信息修正了非规范性语言;按照特定领域词汇的层级关系,对第二输出信息进行聚合处理。本发明专利技术经过对信息进行修正处理,并且经过层级关系进行聚合处理,可提高非规范化语言解析的准确率,利用深度学习模型,提高了系统的泛化能力。提高了系统的泛化能力。提高了系统的泛化能力。

【技术实现步骤摘要】
一种信息处理方法、装置、设备和计算机存储介质


[0001]本专利技术涉及自然语言处理领域,尤其涉及一种信息处理方法、装置、设备和计算机存储介质。

技术介绍

[0002]自然语义理解(NLU)主要包括意图识别和实体抽取两大核心任务。
[0003]现实中,由于用户说话时口语化,或者非规范性的表达,例如很多中文地址信息口语化在地理位置服务中难以应用,而现有的方法主要根据词表匹配的方法进行解析,使得系统泛化能力差,无法支持非规范化地址信息解析等。

技术实现思路

[0004]本专利技术实施例提供了一种信息处理方法、装置、设备和计算机存储介质,具有可提高非规范化语言解析的准确率以及系统的泛化能力。
[0005]本专利技术一方面提供一种信息处理方法,所述方法包括:获取第一输入信息,其中所述第一输入信息中包含非规范性语言;基于所述第一输入信息,生成第二输入信息,其中所述第二输入信息中修正了所述非规范性语言;将所生成的第二输入信息作为深度学习模型的输入进行训练,生成第一输出信息,其中所述第一输出信息包含所述第一输入信息中特定领域词本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取第一输入信息,其中所述第一输入信息中包含非规范性语言;基于所述第一输入信息,生成第二输入信息,其中所述第二输入信息中修正了所述非规范性语言;将所生成的第二输入信息作为深度学习模型的输入进行训练,生成第一输出信息,其中所述第一输出信息包含所述第一输入信息中特定领域词汇的标签信息;基于所述第一输出信息,生成第二输出信息,其中所述第二输入信息中修正了所述非规范性语言;按照所述特定领域词汇的层级关系,对所述第二输出信息进行聚合处理。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一输入信息,生成第二输入信息,包括:利用所述特定领域的词汇表确定所述第一输入信息中的非规范性语言;确定所述词汇表中对应于所述非规范性语言的规范性语言;将所述词汇表中对应的规范性语言替换所述第一输入信息中的非规范性语言。3.根据权利要求2所述的方法,其特征在于,所述确定所述词汇表中对应于所述非规范性语言的规范性语言,包括:将所述非规范性语言与所述词汇表中的各个已存词汇进行相似度比对;将相似度最高的词汇作为所述非规范性语言的规范性语言。4.根据权利要求1所述的方法,其特征在于,所述深度学习模型包括语言表示模型、循环神经网络和条件随机场;所述语言表示模型用于接收所述第二输入信息,对应输出词向量;所述循环神经网络用于接收所述词向量,对应输出中间向量,其中所述中间词向量用于表征给所述第二输入信息内词汇赋予标签信息的概率;所述条件随机场用于接收所述中间向量,生成所述第一输出信息。5.根据权利要求4所述的方法,其特征在于,所述语言表示模型...

【专利技术属性】
技术研发人员:夏林旭李媛媛
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1