基于分类模型的上下文识别的方法和系统技术方案

技术编号：11857620 阅读：105 留言：0更新日期：2015-08-12 01:24

提供了一种基于分类模型的上下文识别的方法和系统。所述方法包括：对语句进行标注；对已标注数据进行特征向量提取；将所提取的特征向量增加上一语句的分类特征以构成新的特征向量；以及使用新的特征向量对分类模型进行训练以得到分类模型。

全部详细技术资料下载

【技术实现步骤摘要】
基于分类模型的上下文识别的方法和系统
本专利技术涉及一种基于分类模型的上下文识别的方法和系统。
技术介绍
问答系统是能够识别用户输入的自然语言文本语句，并做出相应回答的计算机程序。它通过对用户输入语句进行处理分析，最终执行用户请求，返回用户关心的信息，其中包含语句分词、实体识别、语义识别、任务处理及应答等自然语言处理相关技术。在问答系统中，回答的精准性、实时性、惊喜性等都是比较重要的指标，其中精准性又是重中之重，要达到精准的要求，可能需要使用语句上下文识别技术，例如在确定如何回答用户的第二问题时需要考虑用户问的第一问题。例如，在下面的两种情况中，需要上下文识别技术处理才能很好地识别第二问。作为第一示例：第一问：这个商品怎么没货呀第二问：什么时候到货呀在使用第一问的上下文的基础上，可以确定第二问的回答要点：回答用户商品什么时候有货作为另一个示例：第一问：我下了一个订单第二问：什么时候到货呀在使用第一问的上下文的基础上，可以确定第二问的回答要点：回答用户订单配送的时间。目前，问答系统中主要采用预先定义规则的方式来处理下句特殊识别问题，例如AIML(ArtificialIntelligenceMarkupLanguage人工智能标记语言)，通过使用XML语言脚本规则，编写上下文相关句式规则，达到下句回答的匹配。AIML识别实例如下：<categoryA><pattern>是的</pattern><that>你是程序员吗？</that><template>你最擅长的编程语言是什么？</t...

【技术保护点】
一种基于分类模型的上下文识别的方法，包括：对语句进行标注；对已标注数据进行特征向量提取；将所提取的特征向量增加上一语句的分类特征以构成新的特征向量；以及使用新的特征向量对分类模型进行训练以得到分类模型。

【技术特征摘要】
1.一种基于分类模型的上下文识别的方法，包括：对语句进行标注；对已标注数据进行特征向量提取；将所提取的特征向量增加上一语句的分类特征以构成新的特征向量；以及使用新的特征向量对分类模型进行训练以得到分类模型；其中，当没有上一句的分类特征时，将上一句的分类特征置为空。2.根据权利要求1所述的方法，进一步包括对语句进行识别。3.根据权利要求2所述的方法，当需要对语句进行识别时，对所要识别的语句进行特征向量提取，然后将对要识别的语句提取的特征向量增加所要识别的语句的上一句的分类特征，送入分类模型，从而获得所要识别的语句的分类特征。4.根据权利要求1所述的方法，当对语句进行标注时，额外地标注当前语句的上一句的分类特征。5.一种基于分类模型的上下文识别的系统，包括：语句标注模块，用于对语句...

【专利技术属性】
技术研发人员：罗欢，张喜，姜文，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人