基于上下文进行意图识别的方法和系统技术方案

技术编号：12147464 阅读：142 留言：0更新日期：2015-10-03 03:40

本发明专利技术公开了一种基于上下文进行意图识别的方法和系统。所述方法包括：基于用户历史咨询日志，对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注；对每一个问题执行特征提取，以生成训练语料；根据监督学习算法，对所生成的训练语料进行模型训练，以获得训练模型；以及基于所获得的训练模型，对当前的问题进行预估并获得预估后的用户意图识别结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及人工智能领域，特别设及基于上下文进行意图识别的方法和系统。
技术介绍
意图识别是识别一种行为的意图。例如，在问答对话中，提问者每句话都带有一定的意图，应答方根据对方的意图进行回答。相关问题在捜索引擎、聊天机器人等场景下有广泛的应用。尤其在聊天机器人中，意图识别是整个系统的核屯、模块。在回答用户的问题时，就是通过分析用户意图，在了解用户想问什么之后给出相应的答案。现有技术中进行意图识别的方法主要是获取一批数据，然后对每条数据的意图进行人工标注，从而得到训练数据。通过训练数据结合特定的算法训练出模型，并使用所得到的模型对新的语料进行意图识别。然而，当前意图识别大多是基于单句对话的，但是人的对话都是在一定的上下文中进行的，同一句话在不同的上下文中可能表述的意思完全不一样。如果仅仅使用单句进行意图识别完全违背了自然语言的形式，很多意图是无法区分出来的。例如，在京东客服日常咨询的问题中有售后运费（退货产生的费用）和售前运费 (商家寄给客户商品产生的费用）两种。如果用户询问"运费谁出"，仅仅根据该句话无法区分用户是咨询售前运费还是售后运费。当将该句话放到上下文场景中时就很容易区分：如果用户先咨询"我要退货"，再问"运费谁出"，很明显是售后运费；如果先咨询"现在下单什么时候到"，再问"运费谁出"，则是售前运费。由此，可W看到仅仅根据单句的信息进行意图识别存在一些缺陷。一方面，在对训练语料进行人工标注时无法区分很多问题中用户的真实意图，导致不同人标注的结果不一样，从而影响训练数据质量。另一方面，训练出来的模型对...
基于上下文进行意图识别的方法和系统

【技术保护点】
一种基于上下文进行意图识别的方法，包括：基于用户历史咨询日志，对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注；对每一个问题执行特征提取，以生成训练语料；根据监督学习算法，对所生成的训练语料进行模型训练，以获得训练模型；以及基于所获得的训练模型，对当前的问题进行预估并获得预估后的用户意图识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘佳，俞晓光，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人