一种用户意图识别方法以及用户意图识别系统技术方案

技术编号:18497197 阅读:210 留言:0更新日期:2018-07-21 20:13
本发明专利技术涉及用户意图识别方法以及系统。该方法包括:关键实体识别步骤,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及用户意图判断步骤,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果。根据本发明专利技术,能够更准确和全面地识别用户意图。

User intention recognition method and user intention recognition system

The invention relates to a user intention recognition method and a system. The method includes the key entity recognition step, the Natural Language Processing technology analysis of the user dialogues and words, the named entity as the user intention parameter candidate, and the user intent judgment step, the dependency syntax analysis for the user dialogues, and the default user intent. The key candidate sets the word by word fuzzy matching to obtain the intent key words, determine the dependency relationship between the intended keyword and the user intention parameter candidate obtained by the key entity recognition step, and output the user intention recognition result only in the case of the existence of the dependency relationship. According to the invention, users' intentions can be identified more accurately and comprehensively.

【技术实现步骤摘要】
一种用户意图识别方法以及用户意图识别系统
本专利技术涉及数据处理分析技术,具体涉及一种用户意图识别方法以及用户意图识别系统。
技术介绍
现阶段有关对话式语义理解技术的实现方案主要分为面向泛用场景和面向特定场景。前者主要以知识图谱为数据基础,针对用户文字形式的检索需求,通过命名实体识别、实体链接等自然语言处理技术获取意图参数,辅以意图识别关键词匹配(什么、哪、怎么等)的方式进行知识图谱检索并反馈相应答案;后者则以专业知识库为数据基础,通过规则模板的形式扩写已有知识点,针对用户业务意图进行模式匹配,辅以业务关键词匹配的方式进行专业知识库检索并反馈相应答案。无论是泛用场景或是特定场景的对话式语义理解技术,都有其缺陷。面向泛用场景的对话式人工智能,可以同用户进行闲聊,但无法理解用户的业务需求,往往将用户对话信息诉诸网络获取答案;另一方面,面向特定场景虽然可以应付业务需求,却又需要大量人力分析用户对话特征以构建规则模板,针对多业务场景所需要的工作量呈直线上升,模型的可延展性并不好。
技术实现思路
鉴于所述问题,本专利技术旨在提出一种能够以轻量级的解决方案提供一种能够对于用户对话进行准确分析的用户意图识别方法以及用户意图识别系统。本专利技术的用户意图识别方法,其特征在于,包括下述步骤:关键实体识别步骤,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及用户意图判断步骤,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间是否存在依存关系,并且仅在存在依存关系的情况下输出用户意图识别结果。可选地,在所述用户意图判断步骤之后进一步包括:意图参数补全步骤,判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。可选地,所述关键实体识别步骤包括:对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;根据词性标注和命名实体识别结果得到用户意图参数候选;以及将用户意图参数标准化。可选地,所述用户意图判断步骤包括:将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;以及根据所述依存句法分析结果和所述意图关键词匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及若两者之间存在依存关系,则输出用户意图识别结果。可选地,所述意图参数补全步骤包括:判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;根据预设的介词词表,在所述用户对话中检索是否出现相关介词;根据所述用户意图判断步骤得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。可选地,所述自然语言处理技术通过LTP工具包、或者StanfordParser工具包实现,所述依存语法分析通过LTP工具包、或者StanfordParser工具包实现,所述深度学习方法通过Wordvec工具包、或者GloVe工具包实现。本专利技术的用户意图识别系统,其特征在于,包括:关键实体识别模块,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及用户意图判断模块,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别模块获得的所述用户意图参数候选之间是否存在依存关系,并且仅在存在依存关系的情况下输出用户意图识别结果。可选地,进一步包括:意图参数补全模块,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。可选地,所述关键实体识别模块包括:命名实体识别子模块,对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;意图参数获取子模块,根据词性标注和命名实体识别结果得到用户意图参数候选;以及标准化子模块,将用户意图参数候选标准化。可选地,所述用户意图判断模块包括:依存句法分析子模块,将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;模糊匹配子模块,根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;以及第一判断子模块,根据所述依存句法分析结果和所述意图关键词候选匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及输出子模块,若两者之间存在依存关系,则输出用户意图识别结果。可选地,所述意图参数补全模块包括:第二判断子模块,判断所述用户意图判断模块中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;检索子模块,根据预设的介词词表,在所述用户对话中检索是否出现相关介词;补全意图参数子模块,根据所述用户意图判断模块得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。可选地,所述自然语言处理技术通过LTP工具包、或者StanfordParser工具包实现,所述依存语法分析通过LTP工具包、或者StanfordParser工具包实现,所述深度学习方法通过Wordvec工具包、或者GloVe工具包实现。本专利技术的计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述的用户意图识别方法。本专利技术的计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述的用户意图识别方法的步骤。如上所述,根据本专利技术本方案的用户意图识别方法以及用户意图识别系统,能够解决现有方法不能高效应对不同用户针对同一业务需求的不同问询方式,通过关键实体识别和依存句法分析能够更加准确、更加全面地识别用户意图。附图说明图1是表示本专利技术的用户意图识别方法的示意图。图2是表示本专利技术的一个具体实施方式的用户意图识别方法的流程图。图3是表示本专利技术的用户意图识别系统的示意图。如上所述,根据本专利技术本方案的用户意图识别方法以及用户意图识别系统,能够解决现有方法不能高效应对不同用户针对同一业务需求的不同问询方式,通过关键实体识别和依存句法分析能够更加准确、更加全面地识别用户意图。具体实施方式下面介绍的是本专利技术的多个实施例中的一些,旨在提供对本专利技术的基本了解。并不旨在确认本专利技术的关键或决定性的要素或限定所要保护的范围。本专利技术针对现有的对话式语义理解技术无法兼顾面向特定场景和模型化分析流程的问题,即解决现有方法不能高效应对不同用户针对同一业务需求的不同问询方式,有待人工构建冗长的规则模板的问题,提出一种基于关键实体识别和依存句法分析的用户意图识别方法。为实现上述目的,本专利技术的主要技术构思在于,首先,将命名实体识别同关键词模糊匹配相结合,以提升意图参数的识别率,其次基于依存句法分析技本文档来自技高网...

【技术保护点】
1.一种用户意图识别方法,其特征在于,包括下述步骤:关键实体识别步骤,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及用户意图判断步骤,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果。

【技术特征摘要】
1.一种用户意图识别方法,其特征在于,包括下述步骤:关键实体识别步骤,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及用户意图判断步骤,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集逐词模糊匹配得到意图关键词,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系,并且仅在存在所述依存关系的情况下输出用户意图识别结果。2.如权利要求1所述的用户意图识别方法,其特征在于,在所述用户意图判断步骤之后进一步包括:意图参数补全步骤,判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行意图参数补全动作。3.如权利要求1或2所述的用户意图识别方法,其特征在于,所述关键实体识别步骤包括:对用户对话文字作为自然语言处理方法以词为单位进行分词、词性标注和命名实体识别;根据词性标注和命名实体识别结果得到用户意图参数候选;以及将用户意图参数标准化。4.如权利要求1或2所述的用户意图识别方法,其特征在于,所述用户意图判断步骤包括:将所述用户对话文字以句为单位进行依存句法分析并得到依存句法分析结果;根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词匹配结果;以及根据所述依存句法分析结果和所述意图关键词匹配结果,判断所述意图关键词与所述关键实体识别步骤获得的所述用户意图参数候选之间的依存关系;以及若两者之间存在依存关系,则输出用户意图识别结果。5.如权利要求3所述的用户意图识别方法,其特征在于,所述意图参数补全步骤包括:判断所述用户意图判断步骤中输出的用户意图识别结果中意图参数是否已全,若已全则输出所述用户意图识别结果,否则进行下述步骤;根据预设的介词词表,在所述用户对话中检索是否出现相关介词;根据所述用户意图判断步骤得到的所述依存语法分析结果,分析所述介词所对应的宾语并作为补全意图参数的可选项。6.如权利要求3所述的用户意图识别方法,其特征在于,所述自然语言处理技术通过LTP工具包、或者StanfordParser工具包实现,所述依存语法分析通过LTP工具包、或者StanfordParser工具包实现,所述深度学习方法通过Wordvec工具包、或者GloVe工具包实现。7.一种用户意图识别系统,其特征在于,包括:关键实体识别模块,对于用户对话文字以词为单位进行自然语言处理技术分析得到命名实体作为用户意图参数候选;以及用户意图判断模块,对于所述用户对话文字进行依存语法分析,并且根据预设的用户意图关键候选集...

【专利技术属性】
技术研发人员:佘萧寒万四爽费志军王宇张莉敏张琦邱雪涛乐旭刘想
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1