一种基于DenseNet面向电力领域的电话诉求文本分类算法制造技术

技术编号:20425371 阅读:84 留言:0更新日期:2019-02-23 08:34
本发明专利技术公开了一种基于DenseNet面向电力领域的电话诉求文本分类算法,属于文本分类算法技术领域,通过对待分类的文本进行预处理、数据增广、建立词汇字典、词向量id匹配、词向量降维、拼接特征值和随机排列组合拼接后的特征值等操作后获得文本分类器,利用该文本分类器对文本进行分类。本发明专利技术提供的基于DenseNet面向电力领域的电话诉求文本分类算法,能有效弥补传统算法的不足,很好的适应电力诉求文本存在的专业性强、长度差异大、文字和数字混杂等特点,能在保证分类准确率的前提下降低模型的复杂度,实现对电力领域的电话诉求文本进行快速、准确的分类,很好的满足分类要求。

【技术实现步骤摘要】
一种基于DenseNet面向电力领域的电话诉求文本分类算法
本专利技术涉及文本分类算法
,尤其涉及一种基于DenseNet面向电力领域的电话诉求文本分类算法。
技术介绍
随着电网建设的普及和完善,电网用户也越来越多,为了保障电网供电的稳定性、提高用户用电的满意度,电网公司搭建了电话反馈平台,用户可以通过电话反馈平台咨询服务内容、反映用电故障、对电网公司做出评价、向电网公司提出意见或投诉等。为了通过电话反馈平台更好的完善电网公司的建设和服务,需要对电话诉求文本进行分类。现有的分类方法一般是通过卷积神经网络模型对文本进行分类,但是此种分类方法需要较为全面的语料库,而且输出特征单一,利用此种手段对电力领域电话诉求文本这类短文本进行分类存在很大的缺陷。为了改进利用卷积神经网络对电话诉求文本进行分类存在的缺陷,需要通过增加最大池化层和使用不同尺寸的过滤器来增加特征输出,同样,此种改进手段也需要更大的语料库,不同尺寸的过滤器也增加了模型的训练参数量。另外,还需要改变文本特征的流动方式,通过密集连接卷积网络使浅层特征在深层流动,增加特征学习的多样性,提高分类效果。但是,此种手段会加深网络层次本文档来自技高网...

【技术保护点】
1.一种基于DenseNet面向电力领域的电话诉求文本分类算法,其特征在于,包括以下步骤,S1、获取待分类的电话诉求文本;S2、对步骤S1中获取的电话诉求文本进行预处理;S3、根据步骤S2中预处理后的电话诉求文本进行数据增广;S4、根据步骤S3中增广后的数据建立词汇字典;S5、根据步骤S4中建立的词汇字典进行词向量id匹配;S6、对步骤S5中匹配后的词向量进行词向量降维;S7、采用ResNet和DenseNet‑BC对步骤S6中降维后的词向量进行1×1卷积层处理,并对经卷积层处理后得到的相同尺寸的特征值进行拼接;S8、对步骤S7中拼接后的特征值进行随机排列得到高层次特征;S9、利用步骤S8中得...

【技术特征摘要】
1.一种基于DenseNet面向电力领域的电话诉求文本分类算法,其特征在于,包括以下步骤,S1、获取待分类的电话诉求文本;S2、对步骤S1中获取的电话诉求文本进行预处理;S3、根据步骤S2中预处理后的电话诉求文本进行数据增广;S4、根据步骤S3中增广后的数据建立词汇字典;S5、根据步骤S4中建立的词汇字典进行词向量id匹配;S6、对步骤S5中匹配后的词向量进行词向量降维;S7、采用ResNet和DenseNet-BC对步骤S6中降维后的词向量进行1×1卷积层处理,并对经卷积层处理后得到的相同尺寸的特征值进行拼接;S8、对步骤S7中拼接后的特征值进行随机排列得到高层次特征;S9、利用步骤S8中得到的高层次特征对电话诉求文本进行分类,实现分类目的。2.根据权利要求1所述的电话诉求文本分类算法,其特征在于,所述步骤S2中对待分类的电话诉求文本进行的预处理包括去重处理、去噪处理、去停用处理和文本分词处理。3.根据权利要求2所述的电话诉求文本分类算法,其特征在于,所述步骤S2中采用欧式距离对待分类的电话诉求文本进行去重处理。4.根据权利要求...

【专利技术属性】
技术研发人员:王亿陆岷章晨璐汪宇杰李豪帅吴亦灵孔锋峰邱海锋陈杰翁利国陈辉
申请(专利权)人:国网浙江杭州市萧山区供电有限公司浙江中新电力工程建设有限公司自动化分公司浙江中新电力工程建设有限公司国网浙江省电力有限公司杭州供电公司国家电网有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1