【技术实现步骤摘要】
一种基于人工智能的集成学习分类方法
[0001]本专利技术涉及集成学习分类
,具体为一种基于人工智能的集成学习分类方法。
技术介绍
[0002]集成学习是近年来数据挖掘和机器学习领域的研究热点之一,它在处理数据挖掘、智能交通系统、生物信息等领域的各种类型的真实数据具有有效性。集成学习就是将多个弱学习器进行组合,从而获得比单个学习器显著优越的泛化性能。要获得好的集成模型,个体学习器应该“好而不同”,也就是个体学习器要有一定的准确性,并且要有多样性,即学习器之间具有差异。
[0003]目前企业进行客户反馈工单分类的方法主要是采用文本挖掘和人工智能算法建立反馈识别系统,对反馈工单进行智能分类,从而保证在短时间内将反馈工单分配给合适的技术支撑部门进行处理。由于客户反馈文本的长度短,数量大,而引起反馈的原因又多种多样。采用传统的文本分类方法在处理短文本分类任务时就遇到了很大的困难,分类准确性低,效果差。因此我们提出了一种基于人工智能的集成学习分类方法。
技术实现思路
[0004]针对现有技术的不足,本专利 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能的集成学习分类方法,其特征在于:包括以下步骤:S1:对反馈文本进行收集,形成待测样本;S2:对待测样本进行文本特征提取,然后得到文本特征向量;S3:通过集成分类器对待测样本进行分类,得到待测样本的分类结果;S4:在进行S2的同时,根据设定关键字对待测样本文本信息进行提取;S5:根据文本信息提取结果进行分析,得到待测样本的分类结果;S6:对两次待测样本的分类结果进行分析判断,确定最终分类结果;S7:对最终分类结果进行输出。2.根据权利要求1所述的一种基于人工智能的集成学习分类方法,其特征在于:所述S1对反馈文本进行收集,形成待测样本的步骤包括:S11:对反馈文本进行预处理,使反馈文本格式统一,得到优化后的反馈文本;S12:对反馈文本进行文本相似度检测,获得有效反馈文本,形成待测样本。3.根据权利要求2所述的一种基于人工智能的集成学习分类方法,其特征在于:所述S12对反馈文本进行文本相似度检测,获得有效反馈文本的步骤中,通过对收集的反馈文本中的重复文本进行文本相似度检测,将重复文本整合成有效文本,获得有效反馈文本。4.根据权利要求1所述的一种基于人工智能的集成学习分类方法,其特征在于:所述S3通过集成分类器对待测样本进行分类,得到待测样本的分类结果的步骤包括:S31:从历史数据库中获取反馈文本数据集,并将反馈文本数据集分成训练样本集和测试样本集;S32:从训练样本集中取用不同的子训练样本集对集成...
【专利技术属性】
技术研发人员:王芳荣,王昕宇,常志勇,孔铖,栾祥宇,白东升,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。