【技术实现步骤摘要】
本专利技术涉及数据分类领域,具体涉及一种指令识别方法及系统。技术背景随着实时营销的不断发展,对用户需求分析成为及其重要的一部分。通过对用户搜索请求进行语义识别,分析挖掘其请求,获取用户现时需求,从而可向用户实时推送相关需求内容。语义识别,就是对用户搜索内容文字进行分词处理,获取有效关键词并对关键词进行分类处理,进而得出用户需求类别。所谓分词,就是将句子切分成一个一个单独的词。是将连续的句子按照一定的规范重新组合成词序列的过程。以中文分词技术为例,分词技术的目标就是将一句话切分为一个一个单独的中文词语。而将句子切分为单独的词,是实现机器识别人类语言的第一步,因此分词技术至关重要。所谓关键词,就是对分词处理后获得的所有词语进行重要性分析,超过重要性阀值的词语即为关键词。但是目前的指令分析、指令识别技术对用户指令分析的不够准确,基于这种不够准确的分析、识别技术所得到的结论进行的后期处理也会产生较大的偏差。鉴于上述缺陷,本专利技术创作者经过长时间的研究和实践终于获得了本专利技术。
技术实现思路
为解决上述技术缺陷,本专利技术采用的技术方案在于,提供包括步骤:S1,对指令采用两种方法进行切分,得到两种切分结果;S2,判断切分结果是否相同,若否,则执行下述步骤S3;若是,则得到最终切分结果,执行下述步骤S4;S3,确定切分方式分歧,消除分歧得到最终切分结果;S4,将最终切分结果进行指标量化,得到若干关键词;S5,将关键词与分类关联表进行匹配;S6,判断每一个关键词是否能够与分类关联表中类别进行匹配,若否,执行下述步骤S7;若是,执行下述步骤S8;S7,对无法匹配的关 ...
【技术保护点】
一种指令识别方法,其特征在于,包括步骤:S1,对指令采用两种方法进行切分,得到两种切分结果;S2,判断切分结果是否相同,若否,则执行下述步骤S3;若是,则得到最终切分结果,执行下述步骤S4;S3,确定切分方式分歧,消除分歧得到最终切分结果;S4,将最终切分结果进行指标量化,得到若干关键词;S5,将关键词与分类关联表进行匹配;S6,判断每一个关键词是否能够与分类关联表中类别进行匹配,若否,执行下述步骤S7;若是,执行下述步骤S8;S7,对无法匹配的关键词进行分类;S8,确定指令最终分类。
【技术特征摘要】
1.一种指令识别方法,其特征在于,包括步骤:S1,对指令采用两种方法进行切分,得到两种切分结果;S2,判断切分结果是否相同,若否,则执行下述步骤S3;若是,则得到最终切分结果,执行下述步骤S4;S3,确定切分方式分歧,消除分歧得到最终切分结果;S4,将最终切分结果进行指标量化,得到若干关键词;S5,将关键词与分类关联表进行匹配;S6,判断每一个关键词是否能够与分类关联表中类别进行匹配,若否,执行下述步骤S7;若是,执行下述步骤S8;S7,对无法匹配的关键词进行分类;S8,确定指令最终分类。2.如权利要求1所述的指令识别方法,其特征在于,所述步骤S1中,所述两种方法分别为正向最大匹配法与逆向最大匹配法。3.如权利要求1所述的指令识别方法,其特征在于,所述步骤S3具体为:确定两种切分结果出现分歧的分歧字段位置,对该分歧字段位置进行支持性判定,选定支持度因子较高的切分方法对应的切分结果作为最终切分结果。4.如权利要求3所述的指令识别方法,其特征在于,所述步骤S3中,所述支持度因子通过下式确定: S ( 1 / 23 ) = S ( 123 ) S ( 23 ) , ]]> S ( 12 / 3 ) = S ( ...
【专利技术属性】
技术研发人员:李青海,简宋全,侯大勇,邹立斌,
申请(专利权)人:广州精点计算机科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。