面向场景的中文指令识别方法、装置、设备和存储介质制造方法及图纸

技术编号：16876280 阅读：106 留言：0更新日期：2017-12-23 13:35

本发明专利技术提供了一种面向场景的中文指令识别方法、装置、设备和存储介质，其中，面向场景的中文指令识别方法，包括：根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重，其中，错分样本为预测类标识与实际类标识不匹配的测试样本。通过本发明专利技术的技术方案，用包括错分样本的样本集训练修正每个预测模型的预测权重，有效提高了中文指令识别的准确率，而且通过场景预判，有效节省了后台计算资源，提高了中文指令识别的智能化水平。

Scene oriented Chinese instruction recognition methods, devices, devices, and storage media

The invention provides a Scenario Oriented method, Chinese instruction recognition device, device and storage medium, which includes Chinese instruction recognition method, including scene oriented: according to misclassification sample sets and the first predetermined formula, the right to modify the prediction model for each prediction, the misclassified samples for prediction of test samples class identification and identification does not match the actual class. Through the technical scheme of the invention, including the wrong sample sets training each prediction model forecast weight correction, effectively improve the accuracy of Chinese instruction recognition, but also through the scene of anticipation, effectively saving the background computing resources, improve the intelligence level Chinese command recognition.

全部详细技术资料下载

【技术实现步骤摘要】
面向场景的中文指令识别方法、装置、设备和存储介质
本专利技术涉及人机智能交互
，具体而言，涉及一种面向场景的中文指令识别方法、一种面向场景的中文指令识别装置、一种计算机设备和一种计算机可读存储介质。
技术介绍
现代智能问答系统一般包含语音识别、文本解析、句法分析、语义分析、主题识别、解析应答等多个技术环节，其中句法分析中的面向场景的中文指令识别(主要是疑问句句式识别)充当了整个智能问答系统的门户验证功能。相关技术中，句法分析中的面向场景的中文指令识别主要通过疑问词规则模式匹配、转换生成句法分析两大类方法来实现，存在以下技术缺陷：(1)疑问词规则模式匹配，需要十分庞杂且难以穷举所有疑问词表，而且对中文指令的理解比较粗浅，识别的准确率较低。(2)转换生成句法分析，需要预先建立相应的词库集和事先制定句法模式，需要过多的人工干预，智能化程度较低。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此，本专利技术的一个目的在于提供一种面向场景的中文指令识别方法。本专利技术的另一个目的在于提供一种面向场景的中文指令识别装置。本专利技术的再一个目的在于提供一种计算机设备。本专利技术的又一个目的在于提供一种计算机可读存储介质。为了实现上述目的，本专利技术的第一方面的技术方案提供了一种面向场景的中文指令识别方法，包括：根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重，其中，错分样本为预测类标识与实际类标识不匹配的测试样本。在该技术方案中，通过根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重，实现了用预测类标识...
面向场景的中文指令识别方法、装置、设备和存储介质

【技术保护点】
一种面向场景的中文指令识别方法，其特征在于，包括：根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重，其中，所述错分样本为预测类标识与实际类标识不匹配的测试样本。

【技术特征摘要】
1.一种面向场景的中文指令识别方法，其特征在于，包括：根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重，其中，所述错分样本为预测类标识与实际类标识不匹配的测试样本。2.根据权利要求1所述的面向场景的中文指令识别方法，其特征在于，所述根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重，具体包括：根据所述包括错分样本的样本集，交叉验证所述每个预测模型，以确定所述每个预测模型的预测精度；根据所述第一预设公式和所述预测精度，修正所述每个预测模型的预测权重，其中，所述第一预设公式包括：ωi表征为第i个预测模型的预测权重，pi表征为所述第i个预测模型的预测精度，表征为所有预测模型的预测精度之和。3.根据权利要求1所述的面向场景的中文指令识别方法，其特征在于，在所述根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重之前，还包括：根据所述每个预测模型的预测权重和第二预设公式，确定测试样本的预测类标识；若所述测试样本的实际类标识与所述预测类标识不匹配，则确定所述测试样本为所述错分样本；提高所述错分样本的抽样概率，以抽取所述包括错分样本的样本集和以抽取所述错分样本作为新的测试样本，其中，所述第二预设公式包括：pred＝Max(ωi·nj)ωi表征为第i个预测模型的预测权重，nj表征为第j个类标识在所有预测模型中出现的次数，pred表征为Max(ωi·nj)对应的类标识，即所述预测类标识。4.根据权利要求3所述的面向场景的中文指令识别方法，其特征在于，在所述根据所述每个预测模型的预设权重和第二预设公式，确定测试样本的预测类标识之前，还包括：确定所述测试样本中是否包括与预设场景词汇库相匹配的词汇；若确定所述测试样本中不包括与所述预设场景词汇库相匹配的词汇，则发出提示信号，并不进行所述测试样本的预测类标识的确定；若确定所述测试样本中包括与所述预设场景词汇库相匹配的词汇，则以所述预设场景词汇库中相匹配的词汇替换所述测试样本中对应的词汇，并进行所述测试样本的预测类标识的确定。5.根据权利要求3所述的面向场景的中文指令识别方法，其特征在于，所述提高所述错分样本的抽样概率，具体包括：根据第三预设公式，重新确定所述错分样本的抽样概率，其中，所述第三预设公式包括：yk表征为测试样本k的实际类标识，h(k)表征为所述测试样本k的预测类标识，Wk+1表征为重新确定的错分样本k的抽样概率，∑(yk≠h(k))表征为所有错分样本的总数。6.根据权利要求1所述的面向场景的中文指令识别方法，其特征在于，在所述根据包括错分样本的样本集和第一预设公式，修正每个预测模型的预测权重之前，还包括：基于预设规则，根据预设语料库，构建所述预测模型，并预设所述每个预测模型的预测权重。7.一种面向场景的中文指令识别装置，其特征在于，包括：修正单元，用于根据包括错分样本的样本...

【专利技术属性】
技术研发人员：闫永刚，沈亮，
申请(专利权)人：合肥美的智能科技有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人