【技术实现步骤摘要】
文本自动分类方法、设备及存储介质
本申请实施例涉及数据处理
,尤其涉及一种文本自动分类方法、设备及存储介质。
技术介绍
近几年,汽车行业飞速发展,人们在享受汽车带来的便利的同时,针对汽车使用或故障问题也日渐增做。当客户对汽车使用或故障问题进行咨询或投诉时,在解答过程中,工作人员首先需要对汽车使用或故障问题的文本进行分类,而现有对客户咨询或投诉具体分类以人工处理,存在分类速度慢,准确性低的问题。
技术实现思路
本申请实施例提供一种文本自动分类方法、设备及存储介质,以克服对文本进行分类时,存在分类速度慢,准确性低的问题。第一方面,本申请实施例提供一种文本自动分类方法,包括:获取待分类文本;基于文本分类模型,得到所述待分类文本的文本类别,所述文本分类模型是以文本样本集合及其文本类别为样本采用LSTM长短时记忆人工神经网络训练获得的。在一种可能的设计中,所述方法还包括:获取文本样本集合及其文本类别,所述文本样本集合包括不同文本类别的文本样本;根据所述文本样本集合及其文本类别,采用LSTM长短时记忆人工神经网络进行训练,得到所述文本分类模型。在一种可能的设计中,所述获取文 ...
【技术保护点】
1.一种文本自动分类方法,其特征在于,包括:获取待分类文本;基于文本分类模型,得到所述待分类文本的文本类别,所述文本分类模型是以文本样本集合及其文本类别为样本采用LSTM长短时记忆人工神经网络训练获得的。
【技术特征摘要】
1.一种文本自动分类方法,其特征在于,包括:获取待分类文本;基于文本分类模型,得到所述待分类文本的文本类别,所述文本分类模型是以文本样本集合及其文本类别为样本采用LSTM长短时记忆人工神经网络训练获得的。2.根据权利要求1所述的方法,所述方法还包括:获取文本样本集合及其文本类别,所述文本样本集合包括不同文本类别的文本样本;根据所述文本样本集合及其文本类别,采用LSTM长短时记忆人工神经网络进行训练,得到所述文本分类模型。3.根据权利要求2所述的方法,所述获取文本样本集合及其文本类别,包括:获取多个历史文本,并将所述多个历史文本作为所述文本样本集合;根据所述多个历史文本的关键词,确定所述多个历史文本的文本类别。4.根据权利要求2所述的方法,所述根据所述文本样本集合及其文本类别,采用LSTM长短时记忆人工神经网络进行训练,得到所述文本分类模型,包括:提取所述文本样本集合中每个文本样本的语句特征向量,并将每个文本样本的语句特征向量作为训练集的特征向量;将所述训练集的特征向量作为LSTM长短时记忆人工神经网络的第一层输入量,得到训练集的特征向量在邻域内特征点的平均值;将所述训练集的特征向量在邻域内特征点的平均值作为LSTM长短时记忆人工神经网络的第二层输入量,得到文本样本的分布概率函数;将所述分布概率函数作为所述文本分类模型,其中,所述文本分类模型的输出是所述文本样本的文本类别及对应的概率。5.根据权利要求4所述的方法,所述基于文本分类模型,得到所述待分类文本的文本类别,包括:提取所述待分类文本的语句特征向量;将所述待分类文本的语句特征向量作为所述文本分类模型的输入量,得到所述待分类文本的文本类别及对应的概率;将概率最大的文本类别作为所述待分类文本的文本类别。6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:获取测试样本集合,所述测试样本集合包括多个测试样本文本及其标准文本类别;基于所述文本分类模型,得到所述多个测试样本文本的实际文本类别并对应添加至所述测试样本集合中;若所述测试样本集合中,其实际文本类别与标准文本类别一致的测试样本文本的数量达到预设阈值,则确定所述文本分类模型通过可行性验证;所述基于所述文本分类模型,得到所述待分类文本的文本类别,包括:基于通过可行性验证的文本分类模型,得到所述待分类文本的文本类别。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:若所述测试样本集合中,其实际文本类别与标准文本类别一致的测试样本文本的数量低于所述预设阈值,则将所述测试样本集合中的实际文本类别替换标准文本类别,并将替换后的测试样本集合作为新样本,采用LSTM长短时记忆人工神经网络进行训练,得到更新后的文本分类模型。8.一种文本自动分类设备,其特征在于,包括:待分类文本获取模块,用于获取待分类文本;文本类别获取模块,用于基于文本分类模型,得到所述待分类文本的文本类别,所述文本分类模型是以文本样本集合及其文本类别为样本采用LSTM长短时记忆人工神经网络训练获得的。9.根据权利要求8所述的设备,其特征在于...
【专利技术属性】
技术研发人员:耿俊杰,周胜臣,
申请(专利权)人:斑马网络技术有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。