文本识别方法和相关产品技术

技术编号:23343556 阅读:17 留言:0更新日期:2020-02-15 03:56
本申请实施例公开了一种文本识别方法和相关产品。该方法包括:服务器接收客户端的文本查询请求,所述文本查询请求用于请求获取目标服务;所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性,所述目标槽位属性用于肯定或否定所述目标槽位;所述服务器根据所述目标意图、所述目标槽位以及所述目标槽位属性,确定所述目标服务;所述服务器向所述客户端提供所述目标服务。本申请实施例中,服务器在解析文本查询请求的过程中,通过增加槽位属性用于肯定或否定槽位,可以有效解决NLU系统无法精准高效的识别文本查询请求的意图、槽位以及槽位属性信息的问题。

Text recognition methods and related products

【技术实现步骤摘要】
文本识别方法和相关产品
本专利技术涉及自然语言理解(NaturalLanguageUnderstanding,NLU)
,尤其涉及一种文本识别方法和相关产品。
技术介绍
智能助手从诞生开始只是作为电子产品的一个实用性不高的辅助功能,但是随着人工智能、搜索引擎的飞速发展,智能助手在基础行业发挥着越来越巨大的作用,智能助手正在更好的和各种生活场景结合,引导人们以更为方便的模式进行人机交互。但是,当前各种智能助手和工具的智能识别技术水平参差不齐,针对用户输入的文本查询请求,NLU系统无法做到精准高效的识别文本查询请求的意图和槽位信息,并将上述不精准的信息传递给服务,极大伤害了用户的体验,比如,对于用户的某一查询“我要听周杰伦的七里香”,NLU系统会设计相应的播放歌曲意图、歌手槽位和歌曲槽位,但是对于用户查询“我要听七里香,不要周杰伦的版本”,如果再沿用上述的意图槽位设计,服务还是会检索出周杰伦的七里香,违背了用户的期望。针对上述的智能识别技术问题,目前大多数解决方案采用的是新建一个与播放歌曲意图相对立的否定意图,但是,在两个意图之间非常相似的情况下,比如二者差别就是“不”字,这对于文本分类器模型是巨大的挑战,并且每新增加一个否定意图,无论是技能创建者、标注人员、服务侧需要处理维护的意图槽位个数都会翻倍,效率不佳。
技术实现思路
本申请实施例公开了一种文本识别方法和相关产品,在解析文本查询请求的过程中,通过增加槽位属性用于肯定或否定槽位,可以有效解决NLU系统无法精准高效的识别文本查询请求的意图、槽位以及槽位属性信息的问题。第一方面,本申请实施例提供了一种文本识别方法,该方法包括:服务器接收客户端的文本查询请求,所述文本查询请求用于请求获取目标服务;所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性,所述目标槽位属性用于肯定或否定所述目标槽位;所述服务器根据所述目标意图、所述目标槽位以及所述目标槽位属性,确定所述目标服务;所述服务器向所述客户端提供所述目标服务。本申请实施例中,服务器在解析文本查询请求的过程中,得到文本查询请求的目标意图和目标槽位,同时增加了槽位的属性维度信息,用于肯定或否定目标槽位;可以有效解决NLU系统无法精准高效的识别文本查询请求的意图、槽位以及槽位属性信息的问题。在一个可选的实现方式中,所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性包括:查询与所述文本查询请求相匹配的语料和/或模板;利用训练得到的意图分类模型处理所述文本查询请求以得到第一候选意图,以及通过训练得到的槽位抽取模型对所述文本查询请求进行抽取处理以得到第一候选槽位和第一候选槽位属性;在未查询到与所述文本查询请求相匹配的语料且未查询到与所述文本查询请求相匹配的模板的情况下,将所述第一候选意图、所述第一候选槽位以及所述第一候选槽位属性分别作为所述目标意图、所述目标槽位以及所述目标槽位属性。在该实现方式中,服务器对文本查询请求进行语料匹配和/或模板匹配,可能仅得到符合要求的目标语料或目标模板,也可能均得到符合要求的目标语料和目标模板,还可能均未得到符合要求的目标语料和目标模板,服务器也通过模型处理文本查询请求得到第一候选意图、第一候选槽位以及第一候选槽位属性,因此具有多种可能得到的结果,本实现方式说明了在均未得到目标语料和目标模板的情况下,将第一候选意图、第一候选槽位以及第一候选槽位属性分别作为目标意图、目标槽位以及目标槽位属性;可以增加可能得到的结果,提高识别文本查询请求的意图、槽位以及槽位属性信息的精准度。在一个可选的实现方式中,所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性还包括:在查询到与所述文本查询请求相匹配的目标语料的情况下,将所述目标语料的意图、槽位以及槽位属性分别作为所述文本查询请求的第二候选意图、第二候选槽位以及第二候选槽位属性;和/或,在查询到与所述文本查询请求相匹配的目标模板的情况下,根据所述目标模板确定所述文本查询请求的意图、槽位以及槽位属性以得到第三候选意图、第三候选槽位以及第三候选槽位属性;选择第一候选集合、第二候选集合和/或第三候选集合中的任一候选集合,得到目标候选集合;所述目标候选集合包括所述目标意图、所述目标槽位以及所述目标槽位属性;所述第一候选集合包括所述第一候选意图、所述第一候选槽位、所述第一候选槽位属性,所述第二候选集合包括所述第二候选意图、所述第二候选槽位、所述第二候选槽位属性,所述第三候选集合包括所述第三候选意图、所述第三候选槽位、所述第三候选槽位属性。在该实现方式中,补充说明了其他几种可能得到的结果,分别为第一候选集合、第二候选集合和/或第三候选集合,并在上述几种可能得到的结果的情况下,选择最符合文本查询请求的要求的目标候选集合作为文本查询请求的目标意图、目标槽位以及目标槽位属性;可以提高识别文本查询请求的意图、槽位以及槽位属性信息的精准度。在一个可选的实现方式中,所述查询与所述文本查询请求相匹配的语料和/或模板,包括:查询语料库中与所述文本查询请求相匹配的语料,得到所述目标语料,将所述目标语料的意图、槽位以及槽位属性分别作为所述文本查询请求的所述第二候选意图、所述第二候选槽位以及所述第二候选槽位属性;和/或,查询模板库中与所述文本查询请求匹配的模板,得到所述目标模板,所述目标模板的意图、槽位以及槽位属性分别作为所述文本查询请求的所述第三候选意图、所述第三候选槽位以及所述第三候选槽位属性。在该实现方式中,服务器对文本查询请求进行语料匹配和/或模板匹配,进行语料匹配的准确率高,可以快速识别符合文本查询请求要求的目标意图、目标槽位以及目标槽位属性,进行模板匹配的泛化性好,可以高效的识别得到结果。在一个可选的实现方式中,所述通过训练得到的槽位抽取模型对所述文本查询请求进行抽取处理以得到第一候选槽位和第一候选槽位属性,包括:利用所述槽位抽取模型抽取所述文本查询请求,得到所述第一候选槽位;获取所述第一候选槽位前面长度为N的字面量窗口,在所述字面量窗口包含否定词且不包含重复字的情况下,确定所述第一候选槽位属性用于否定所述第一候选槽位;其中,N为大于零的整数。在该实现方式中,服务器通过模型处理得到第一候选意图和第一候选槽位,再通过第一候选槽位前面的字面量窗口判断得到第一候选槽位属性,该模型处理得到的结果准确率高召回率低,可以有效处理那些语料匹配、模板匹配没能处理的文本查询请求。在一种可选的实现方式中,所述通过训练得到的槽位抽取模型对所述文本查询请求进行抽取处理以得到第一候选槽位和第一候选槽位属性,包括:利用所述槽位抽取模型抽取所述文本查询请求,得到所述第一候选槽位;利用训练得到的二分类模型,确定所述第一候选槽位的属性,得到所述第一候选槽位属性。在该实现方式中,先基于上述本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n服务器接收客户端的文本查询请求,所述文本查询请求用于请求获取目标服务;/n所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性,所述目标槽位属性用于肯定或否定所述目标槽位;/n所述服务器根据所述目标意图、所述目标槽位以及所述目标槽位属性,确定所述目标服务;/n所述服务器向所述客户端提供所述目标服务。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
服务器接收客户端的文本查询请求,所述文本查询请求用于请求获取目标服务;
所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性,所述目标槽位属性用于肯定或否定所述目标槽位;
所述服务器根据所述目标意图、所述目标槽位以及所述目标槽位属性,确定所述目标服务;
所述服务器向所述客户端提供所述目标服务。


2.根据权利要求1所述的一种文本识别方法,其特征在于,所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性,包括:
查询与所述文本查询请求相匹配的语料和/或模板;
利用训练得到的意图分类模型处理所述文本查询请求以得到第一候选意图,以及通过训练得到的槽位抽取模型对所述文本查询请求进行抽取处理以得到第一候选槽位和第一候选槽位属性;
在未查询到与所述文本查询请求相匹配的语料且未查询到与所述文本查询请求相匹配的模板的情况下,将所述第一候选意图、所述第一候选槽位以及所述第一候选槽位属性分别作为所述目标意图、所述目标槽位以及所述目标槽位属性。


3.根据权利要求2所述的一种文本识别方法,其特征在于,所述服务器解析所述文本查询请求,得到所述文本查询请求的目标意图、目标槽位以及目标槽位属性,还包括:
在查询到与所述文本查询请求相匹配的目标语料的情况下,将所述目标语料的意图、槽位以及槽位属性分别作为所述文本查询请求的第二候选意图、第二候选槽位以及第二候选槽位属性;
和/或,在查询到与所述文本查询请求相匹配的目标模板的情况下,根据所述目标模板确定所述文本查询请求的意图、槽位以及槽位属性以得到第三候选意图、第三候选槽位以及第三候选槽位属性;
选择第一候选集合、第二候选集合和/或第三候选集合中的任一候选集合,得到目标候选集合;所述目标候选集合包括所述目标意图、所述目标槽位以及所述目标槽位属性;所述第一候选集合包括所述第一候选意图、所述第一候选槽位、所述第一候选槽位属性,所述第二候选集合包括所述第二候选意图、所述第二候选槽位、所述第二候选槽位属性,所述第三候选集合包括所述第三候选意图、所述第三候选槽位、所述第三候选槽位属性。


4.根据权利要求2或3所述的一种文本识别方法,其特征在于,所述查询与所述文本查询请求相匹配的语料和/或模板,包括:
查询语料库中与所述文本查询请求相匹配的语料,得到所述目标语料,将所述目标语料的意图、槽位以及槽位属性分别作为所述文本查询请求的所述第二候选意图、所述第二候选槽位以及所述第二候选槽位属性;
和/或,查询模板库中与所述文本查询请求匹配的模板,得到所述目标模板,所述目标模板的意图、槽...

【专利技术属性】
技术研发人员:王明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1