【技术实现步骤摘要】
文本分类处理方法和装置
本专利技术涉及文本分类领域,具体而言,涉及一种文本分类处理方法和装置。
技术介绍
在泛在电力物联网的大背景下,95598客户服务系统作为泛在电力物联网应用的重要组成部分,登记了海量客户信息。当前主要依靠人工统计工单分析,产生效率不足等相关问题。由于在95598客户诉求数据量较大,人工分类效率低,无法做到精准高效分类。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种文本分类处理方法和装置,以至少解决现有技术依靠人工方式对文本进行分类的技术问题。根据本专利技术实施例的一个方面,提供了一种文本分类处理方法,包括:获取待分类的文本;将所述待分类的文本输入到模型当中,其中,所述模型为使用训练数据通过机器学习训练所得到的;将从所述模型中获取的输出作为所述待分类的文本对应的类别;保存所述待分类的文本和其对应的类别。可选地,在获取所述待分类的文本之前,所述方法还包括:使用多组训练数据通过机器学习进行训练得到所述模型。可选地,通过 ...
【技术保护点】
1.一种文本分类处理方法,其特征在于,包括:/n获取待分类的文本;/n将所述待分类的文本输入到模型当中,其中,所述模型为使用训练数据通过机器学习训练所得到的;/n将从所述模型中获取的输出作为所述待分类的文本对应的类别;/n保存所述待分类的文本和其对应的类别。/n
【技术特征摘要】
1.一种文本分类处理方法,其特征在于,包括:
获取待分类的文本;
将所述待分类的文本输入到模型当中,其中,所述模型为使用训练数据通过机器学习训练所得到的;
将从所述模型中获取的输出作为所述待分类的文本对应的类别;
保存所述待分类的文本和其对应的类别。
2.根据权利要求1所述的方法,其特征在于,在获取所述待分类的文本之前,所述方法还包括:
使用多组训练数据通过机器学习进行训练得到所述模型。
3.根据权利要求2所述的方法,其特征在于,通过机器学习进行训练得到所述模型包括:
使用第一语料集进行预训练得到第一模型;
使用第二语料集对所述第一模型进行迭代训练得到所述模型,其中,所述第二语料集包括多组数据,每一组数据均包括文本以及该文本所对应的类别。
4.根据权利要求3所述的方法,其特征在于,使用所述第一语料集进行预训练得到第一模型包括:
通过BERT使用所述第一语料集进行训练得到所述第一模型,其中,在所述训练中掩盖语料集中的每一条语料的部分内容,所述训练用于预测所掩盖的内容。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述文本包括工单文本,所述类别包括:工单的类型,其中,所述类型包括至少一类。
6...
【专利技术属性】
技术研发人员:张禄,及洪泉,姚晓明,胡彩娥,丁屹峰,王培祎,马龙飞,陆斯悦,王健,徐蕙,
申请(专利权)人:国网北京市电力公司,国家电网有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。