一种基于云计算对客体进行意图识别的方法技术

技术编号:27318490 阅读:13 留言:0更新日期:2021-02-10 09:55
本申请公开了一种基于云计算对客体进行意图识别的方法,所述识别方法包括构建分类器,通过特征处理模块将特征处理过后的训练集建立成训练文本分类器;建立分类模型,通过所述步骤1构成的分类器建立分类模型,通过云计算抽取特征向量与对应的期望输出;建立意图分类模型,通过云计算网络建立意图训练集;接受意图信息,接收到意图信息后通过所述步骤3中的意图分类模型对意图进行初步分类;识别结果,所述步骤4中对所接收的意图进行初步分类后利用云计算将分类结果映射至分类模型中的特征向量,从而通过确定特征向量定位与其对应的期望输出,被定为的期望输出则为意图的识别结果。本申请提供了一种基于云计算对客体进行意图识别的方法。意图识别的方法。意图识别的方法。

【技术实现步骤摘要】
一种基于云计算对客体进行意图识别的方法


[0001]本申请涉及一种意图识别的方法,具体是一种基于云计算对客体进行意图识别的方法。

技术介绍

[0002]意图识别方法是一种根据语句识别该语句的意图的识别方法,意图识别方法可以应用在各个领域,如移动终端对用户的意图识别以向用户提供相应的服务。例如,用户说出“我想打车回家”,则识别出用户的意图是想使用打车服务打车回到用户的住所,或者,用户说出“我想听歌”,则识别出用户的意图想使移动终端播放音乐。
[0003]传统的意图识别方法没有较为详细的特征提取步骤,同时识别效率低。因此,针对上述问题提出一种基于云计算对客体进行意图识别的方法。

技术实现思路

[0004]一种基于云计算对客体进行意图识别的方法,所述识别方法包括如下步骤:
[0005]步骤1、构建分类器,先通过云计算网络建立训练集,然后将训练集通过特征处理模块进行特征处理,在特征处理的过程中生成特征向量以及期望输出,通过特征处理模块将特征处理过后的训练集建立成训练文本分类器;
[0006]步骤2、建立分类模型,通过所述步骤1构成的分类器建立分类模型,通过云计算抽取特征向量与对应的期望输出,按照固定的格式进行,一起输入至云计算中进行计算,训练出一个预测模型,通过整合预测模型和分类器形成分类模型;
[0007]步骤3、建立意图分类模型,通过云计算网络建立意图训练集,利用云计算对意图训练集进行特征化处理,在特征化处理的过程中生成意图特征向量,然后通过云计算抽取意图特征向量以及与之对应的意图类别;
[0008]步骤4、接受意图信息,接收到意图信息后通过所述步骤3中的意图分类模型对意图进行初步分类;
[0009]步骤5、识别结果,所述步骤4中对所接收的意图进行初步分类后利用云计算将分类结果映射至分类模型中的特征向量,从而通过确定特征向量定位与其对应的期望输出,被定为的期望输出则为意图的识别结果。
[0010]进一步地,在所述步骤(1)构建分类器的过程中对新到的数据采取同样的特征抽取,得到用于预测的特征向量;使用训练好的预测模型,对处特征处理后的新数据进行预测,并返回结果。
[0011]进一步地,在所述步骤(1)中对中文进行分词时,采用基于词典的中文分词和/或基于统计的中文分词。
[0012]进一步地,所述基于词典的中文分词的核心是建立统一的词典表,当需要对一个句子进行分词时,首先将句子拆分成多个部分,将每一个部分与字典一一对应,如果该词语在词典中,分词成功,否则继续拆分匹配直到成功。
[0013]进一步地,在所述基于统计的中文分词统计学中认为分词是一个概率最大化问题,即拆分句子,基于语料库,统计相邻的字组成的词语出现的概率,相邻的词出现的次数多,就出现的概率大,按照概率值进行分词。
[0014]进一步地,在步骤(2)中利用TF和IDF两个参数来表示词语在文本中的重要程度,实现特征提取。
[0015]进一步地,所述TF是词频,指的是一个词语在一个文档中出现的频率,一般情况下,每一个文档中出现的词语的次数越多词语的重要性更大,例如BOW模型一样用出现次数来表示特征值,即出现文档中的词语次数越多,其权重就越大,问题就是在长文档中的词语次数普遍比短文档中的次数多,导致特征值偏向差异情况。
[0016]进一步地,所述步骤IDF是体现词语在文档间的重要性,即如果某个词语出现在极少数的文档中,说明该词语对于文档的区别性强,对应的特征值高,IDF值高,IDFi=log(|D|/Ni),D指的是文档总数,Ni指的是出现词语i的文档个数,很明显Ni越小,IDF的值越大,最终TF-IDF的特征值的表达式为:TF-IDF(i,j)=TFij*IDFi。
[0017]进一步地,所述步骤(4)中接收意图信息的方式为互联网接收和物理键盘输入。
[0018]进一步地,所述步骤(5)中在定位期望输出时通过云计算进行错误修正。
[0019]本申请的有益效果是:本申请提供了一种效率较高的基于云计算对客体进行意图识别的方法。
附图说明
[0020]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0021]图1为本申请一种实施例的方法流程结构示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0023]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0024]在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或
位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
[0025]并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
[0026]此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
[0027]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0028]实施例一
[0029]请参阅图1所示,一种基于云计算对客体进行意图识别的方法,所述识别方法包括如下步骤:
[0030]步骤1、构建分类器,先通过云计算网络建本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于云计算对客体进行意图识别的方法,其特征在于:所述识别方法包括如下步骤:步骤1、构建分类器,先通过云计算网络建立训练集,然后将训练集通过特征处理模块进行特征处理,在特征处理的过程中生成特征向量以及期望输出,通过特征处理模块将特征处理过后的训练集建立成训练文本分类器;步骤2、建立分类模型,通过所述步骤1构成的分类器建立分类模型,通过云计算抽取特征向量与对应的期望输出,按照固定的格式进行,一起输入至云计算中进行计算,训练出一个预测模型,通过整合预测模型和分类器形成分类模型;步骤3、建立意图分类模型,通过云计算网络建立意图训练集,利用云计算对意图训练集进行特征化处理,在特征化处理的过程中生成意图特征向量,然后通过云计算抽取意图特征向量以及与之对应的意图类别;步骤4、接受意图信息,接收到意图信息后通过所述步骤3中的意图分类模型对意图进行初步分类;步骤5、识别结果,所述步骤4中对所接收的意图进行初步分类后利用云计算将分类结果映射至分类模型中的特征向量,从而通过确定特征向量定位与其对应的期望输出,被定为的期望输出则为意图的识别结果。2.根据权利要求1所述的一种基于云计算对客体进行意图识别的方法,其特征在于:在所述步骤(1)构建分类器的过程中对新到的数据采取同样的特征抽取,得到用于预测的特征向量;使用训练好的预测模型,对处特征处理后的新数据进行预测,并返回结果。3.根据权利要求1所述的一种基于云计算对客体进行意图识别的方法,其特征在于:在所述步骤(1)中对中文进行分词时,采用基于词典的中文分词和/或基于统计的中文分词。4.根据权利要求3所述的一种基于云计算对客体进行意图识别的方法,其特征在于:所述基于词典的中文分词的核心是建立统一的词典表,当需要对一个句子进行分词时,首先将句子拆分成多个部分,将每一个部分与字典一...

【专利技术属性】
技术研发人员:杜珍珍
申请(专利权)人:武汉贝多多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1