文本分类处理方法和装置制造方法及图纸

技术编号:24331250 阅读:31 留言:0更新日期:2020-05-29 19:40
本发明专利技术公开了一种文本分类处理方法和装置。其中,该方法包括:获取待分类的文本;将待分类的文本输入到模型当中,其中,模型为使用训练数据通过机器学习训练所得到的;将从模型中获取的输出作为待分类的文本对应的类别;保存待分类的文本和其对应的类别。本发明专利技术解决了现有技术依靠人工方式对文本进行分类的技术问题。

【技术实现步骤摘要】
文本分类处理方法和装置
本专利技术涉及文本分类领域,具体而言,涉及一种文本分类处理方法和装置。
技术介绍
在泛在电力物联网的大背景下,95598客户服务系统作为泛在电力物联网应用的重要组成部分,登记了海量客户信息。当前主要依靠人工统计工单分析,产生效率不足等相关问题。由于在95598客户诉求数据量较大,人工分类效率低,无法做到精准高效分类。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种文本分类处理方法和装置,以至少解决现有技术依靠人工方式对文本进行分类的技术问题。根据本专利技术实施例的一个方面,提供了一种文本分类处理方法,包括:获取待分类的文本;将所述待分类的文本输入到模型当中,其中,所述模型为使用训练数据通过机器学习训练所得到的;将从所述模型中获取的输出作为所述待分类的文本对应的类别;保存所述待分类的文本和其对应的类别。可选地,在获取所述待分类的文本之前,所述方法还包括:使用多组训练数据通过机器学习进行训练得到所述模型。可选地,通过机器学习进行训练得到本文档来自技高网...

【技术保护点】
1.一种文本分类处理方法,其特征在于,包括:/n获取待分类的文本;/n将所述待分类的文本输入到模型当中,其中,所述模型为使用训练数据通过机器学习训练所得到的;/n将从所述模型中获取的输出作为所述待分类的文本对应的类别;/n保存所述待分类的文本和其对应的类别。/n

【技术特征摘要】
1.一种文本分类处理方法,其特征在于,包括:
获取待分类的文本;
将所述待分类的文本输入到模型当中,其中,所述模型为使用训练数据通过机器学习训练所得到的;
将从所述模型中获取的输出作为所述待分类的文本对应的类别;
保存所述待分类的文本和其对应的类别。


2.根据权利要求1所述的方法,其特征在于,在获取所述待分类的文本之前,所述方法还包括:
使用多组训练数据通过机器学习进行训练得到所述模型。


3.根据权利要求2所述的方法,其特征在于,通过机器学习进行训练得到所述模型包括:
使用第一语料集进行预训练得到第一模型;
使用第二语料集对所述第一模型进行迭代训练得到所述模型,其中,所述第二语料集包括多组数据,每一组数据均包括文本以及该文本所对应的类别。


4.根据权利要求3所述的方法,其特征在于,使用所述第一语料集进行预训练得到第一模型包括:
通过BERT使用所述第一语料集进行训练得到所述第一模型,其中,在所述训练中掩盖语料集中的每一条语料的部分内容,所述训练用于预测所掩盖的内容。


5.根据权利要求1至4中任一项所述的方法,其特征在于,所述文本包括工单文本,所述类别包括:工单的类型,其中,所述类型包括至少一类。


6...

【专利技术属性】
技术研发人员:张禄及洪泉姚晓明胡彩娥丁屹峰王培祎马龙飞陆斯悦王健徐蕙
申请(专利权)人:国网北京市电力公司国家电网有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1