一种信息识别方法及装置制造方法及图纸

技术编号:29527339 阅读:14 留言:0更新日期:2021-08-03 15:13
本申请公开了一种信息处理方法及装置,在接收到待处理信息后,首先,对待处理信息进行意图识别,得到待处理信息的目标意图;其次,根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集;并且,基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取,得到待处理信息包括的第二槽位集;最后,根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。如此,增加第二次槽位信息提取过程,充分的利用各个槽位之间的关系、主题信息以及结构信息等,有效召回第一次槽位信息提取过程中所遗漏的槽位,有效增加槽位信息提取的准确率和效率。从而,有效减少信息交互过程中的交流轮次,显著提升用户体验。

【技术实现步骤摘要】
一种信息识别方法及装置
本申请涉及人工智能
,尤其涉及一种信息识别方法及装置。
技术介绍
随着AI技术的发展,chatbot(对话系统)应用已经非常广泛,并且对chatbot的系统性能提出来了更高的要求。chatbot的槽位的识别率、交流轮次是评价chatbot的重要性能指标,能够在更少的交流轮次中获取更多的信息才能够有效提高用户体验。对话系统完整的NLU(NatureLanguageUnderstanding,自然语言理解)包括领域意图识别和槽位提取。领域意图识别用于告诉机器用户查询的内容,例如:查询天气,槽位提取用于告诉机器对于所识别到的意图需要填充的槽位的详细的信息,例如:查询天气的时间、查询天气的地点、音视频播放的内容进度和播放音视频的日期等。在槽位提取过程中,由于数据、模型等因素的限制,易导致槽位的遗漏,从而导致需要填充的槽位信息的缺失。目前主要采用启动下二轮对话的方式来解决这一问题,机器主动询问用户未识别到的槽位信息。例如,用户提出“我可能过两天要去别的地方出差,嗯然后估计要在硅谷待几天,穿什么有推荐吗”。chatbot只识别出领域意图是查询天气,查询天气需要填充的槽位包括时间和地点,地点是北京,但遗漏了时间,此时系统将发起第二轮对话,询问用户需要查询哪一天的时间。该方案中交流轮次的增加,对于用户问题的处理时间有一定延迟,影响chatbot性能,并严重降低用户的体验感。申请内容本申请提供一种信息处意图识别模块理方法及装置。根据本申请第一方面,提供了一种信息处理方法,所述方法包括:接收待处理信息;对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。根据本申请的另一实施例,基于所述目标意图信息和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量;对所述输入特征向量进行槽位信息提取,得到所述第二槽位集。根据本申请的另一实施例,所述输入特征向量包括所述待处理信息包括的字的字向量、位置向量和槽位标签向量;相应的,所述根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量,包括:根据所述第一槽位集包括的第一槽位标签信息,确定所述待处理信息包括的字的槽位标签向量;确定所述待处理信息的字的字向量和位置向量;其中,所述位置向量用于示出所述待处理信息中的每一个字在所述待处理信息中的位置。根据本申请的另一实施例,对所述输入特征向量进行槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:对所述输入特征向量进行拼接,得到拼接向量;对所述拼接向量进行降维处理,得到编码向量;对所述待处理信息进行语义分析,得到语义分析结果;根据所述语义分析结果,确定所述待处理信息的字的语义向量;根据所述目标意图,确定所述待处理信息的字的意图向量;对所述编码向量、所述语义向量和所述意图向量进行归一化处理,得到所述待处理信息包括的第二槽位集。根据本申请的另一实施例,所述对所述待处理信息进行语义分析,得到语义分析结果,包括:对所述待处理信息进行句法构造和依存关系分析中的至少之一,得到所述语义分析结果。根据本申请的另一实施例,在基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取之前,所述方法还包括:获取若干个训练语料,所述训练语料包括语句内容、所述语句内容的意图信息和槽位标签信息;根据所述语句内容、所述意图信息和所述槽位标签信息,训练第一槽位信息提取模型,以对所述待处理信息进行第一次槽位信息提取。根据本申请的另一实施例,所述方法还包括:对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果;根据所述语句内容、所述意图标注结果和所述槽位标注结果,训练第二槽位信息提取模型,以对所述待处理信息进行第二次槽位信息提取。根据本申请的另一实施例,对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果,包括:采用随机抽取的方式,对所述槽位标签信息中的至少部分标签进行掩蔽处理,得到所述槽位标注结果。根据本申请的另一实施例,所述根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果,包括:对所述第一槽位集和所述槽位集进行合并,得到槽位标签集合和槽位词汇集合;对所述槽位标签集合和所述槽位词汇集合进行去重处理,得到所述信息识别结果。根据本申请第二方面,还公开了一种信息识别装置,所述装置包括:接收模块,用于接收待处理信息;意图识别模块,用于对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;第一提取模块,用于根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;第二提取模块,用于基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;信息处理模块,用于根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。本申请实施例信息处理方法及装置,在接收到待处理信息后,首先,对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;其次,根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;并且,基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;最后,根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。如此,增加第二次槽位信息提取过程,充分的利用各个槽位之间的关系、主题信息以及结构信息等,有效召回第一次槽位信息提取过程中所遗漏的槽位,有效增加槽位信息提取的准确率和效率。从而,有效减少信息交互过程中的交流轮次,显著提升用户体验。需要理解的是,本申请的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本申请的其他实施方式还能够实现上面未提到的有益效果。附图说明通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:在附图中,相同或对应的标号表示相同或对应的部分。图1示出了本申请一实施例信息识别方法的实现流程示意图;图2示出了本申请另一实施例信息识别方法的实现流程示意图;图3示出了本申请一实施例信息识别方法的第二槽位信息提取模型的模型结构示意图;图4示出了本申请实施例信息识别装置的组成结构示意图。具体实施方式下面将参考若干示例性实施方式本文档来自技高网...

【技术保护点】
1.一种信息处理方法,所述方法包括:/n接收待处理信息;/n对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;/n根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;/n基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;/n根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。/n

【技术特征摘要】
1.一种信息处理方法,所述方法包括:
接收待处理信息;
对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;
根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;
基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;
根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。


2.根据权利要求1所述的方法,基于所述目标意图信息和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:
根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量;
对所述输入特征向量进行槽位信息提取,得到所述第二槽位集。


3.根据权利要求2所述的方法,所述输入特征向量包括所述待处理信息包括的字的字向量、位置向量和槽位标签向量;
相应的,所述根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量,包括:
根据所述第一槽位集包括的第一槽位标签信息,确定所述待处理信息包括的字的槽位标签向量;
确定所述待处理信息的字的字向量和位置向量;
其中,所述位置向量用于示出所述待处理信息中的每一个字在所述待处理信息中的位置。


4.根据权利要求2所述的方法,对所述输入特征向量进行槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:
对所述输入特征向量进行拼接,得到拼接向量;
对所述拼接向量进行降维处理,得到编码向量;
对所述待处理信息进行语义分析,得到语义分析结果;
根据所述语义分析结果,确定所述待处理信息的字的语义向量
根据所述目标意图,确定所述待处理信息的字的意图向量;
对所述编码向量、所述语义向量和所述意图向量进行归一化处理,得到所述待处理信息包括的第二槽位集。


5.根据权利要求4所述的方法,所述对所述待处理信息进行语义分...

【专利技术属性】
技术研发人员:张东海卓雷
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1