进行语句识别的方法及装置制造方法及图纸

技术编号：11898255 阅读：39 留言：0更新日期：2015-08-19 09:38

本发明专利技术公开了进行语句识别的方法及装置，其中，该方法包括：定制出映射分类器，映射分类器中设置特征向量与分类结果之间的映射关系；将普通分类器和映射分类器组合成弱分类器；将语料样本输入弱分类器进行分类识别，所述语料样本包含实例语料的特征向量；将弱分类器识别出的分类结果与标准分类结果进行比较，如果一致，则分类正确，如果不一致，则分类错误；根据错误率设置相应弱分类器的权重；将待分类语句输入各弱分器，弱分类器对待分类语句进行分类，得到分类结果；对输出相同分类结果的所有弱分类器的权重进行统计，得到相应分类结果的几率值；将几率值最大的分类结果作为待分类语句的最终识别结果。本发明专利技术方案能够提高对语句识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息处理技术，尤其涉及进行语句识别的方法及装置。
技术介绍
目前的信息处理应用中，常涉及对语句进行识别以确定其分类结果的场景。例如，在网络问答系统中，用户输入自然语言文本语句，网络侧对其进行识别，得到分类结果，根据分类结果提取出对应的应答数据，反馈给用户。该实例通过对用户输入的语句进行处理分析，最终执行用户请求，返回用户所需的信息。问答系统中，回答的准确性是比较重要的核定指标。要想回答精准，须尽可能精准的识别出语句的分类结果。现有进行语句识别的方案一般基于普通分类模型(如支持向量机，随机森林、贝叶斯、Adaboost等)实现，具体包括:采用实例语料对普通分类器进行训练，得到训练后的分类模型。后续在需要时，向训练后的分类模型输入语句，将返回一个分类结果。有了分类结果后，就可以调用相应的任务处理逻辑组装回答用户的问题了。现有通过普通分类器进行语句识别的方案存在以下缺陷:由于普通分类模型基于对实例语料进行统计的方式训练得到，它识别的正确率到了一定程度后就不容易提升，并且对于一些相差非常小的语句很难识别准确。综上，现有进行语句识别的方案具有局限性，且识别准确率低。
技术实现思路
本专利技术提供了一种进行语句识别的方法，该方法能够提高对语句识别的准确率。本专利技术提供了一种进行语句识别的装置，该装置能够提高对语句识别的准确率。一种进行语句识别的方法，该方法包括:对实例语料进行分类标注，得到标准分类结果；并对实例语料进行特征向量提取；定制出映射分类器，映射分类器中设置特征向量与分类结果之间的映射关系；将普通分类器和映射分类器组合成弱分类器；将...

【技术保护点】
一种进行语句识别的方法，其特征在于，对实例语料进行分类标注，得到标准分类结果；并对实例语料进行特征向量提取；定制出映射分类器，映射分类器中设置特征向量与分类结果之间的映射关系；将普通分类器和映射分类器组合成弱分类器；将语料样本输入弱分类器进行分类识别，所述语料样本包含实例语料的特征向量；当弱分类器为普通分类器时，先对普通分类器进行训练，再由训练后的分类模型进行分类识别；将弱分类器识别出的分类结果与标准分类结果进行比较，如果一致，则分类正确，如果不一致，则分类错误；统计出弱分类器分类识别的错误率，根据错误率设置相应弱分类器的权重；该方法还包括：将待分类语句输入各弱分类器，弱分类器对待分类语句进行分类，得到分类结果；对输出相同分类结果的所有弱分类器的权重进行统计，得到相应分类结果的几率值；将几率值最大的分类结果作为待分类语句的最终识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：罗欢，李杰，汤鹏飞，王智，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人