基于双向lstm的维修分类系统技术方案

技术编号：25708752 阅读：15 留言：0更新日期：2020-09-23 02:55

本发明专利技术公开了一种基于双向lstm的维修分类系统，涉及网络技术领域，该基于双向lstm的维修分类系统首先是根据某单位的维修的文本数据，利用keras、jieba等开源软件框架实现数据预处理、文本分词向量化、构建双向LSTM神经网络、自定义实现注意力机制、使用GPU训练神经网络等一些列步骤。使得整个模型的测试集准确率达到98％以上，完全达到企业级应用的标准。该基于双向lstm的维修分类系统使用神经网络结合自然语言处理技术，实现根据申请的文本进行自动分类的效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于双向lstm的维修分类系统
本专利技术涉及网络
，具体来说，本专利技术涉及一种基于双向lstm的维修分类系统。
技术介绍
目前维修分类工作主要依靠人力去完成，用户发出维修请求的文本或者语音，负责维修分类的工作人员对维修的工作进行分类。用户首先需要通过电话、网络等方式将自己的维修请求反映给负责维修分类的工作人员，这项工作过度依靠维修分类的工作人员相应的经验来判断分类，存在信息传达不及时，或者维修分类的工作人员过少而导致处理工作不及时等问题，但是如果投入的维修分类工作人员过多则相应的人力成本过高。所以这项工作往往效率不高，而且成本过高。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于双向lstm的维修分类系统，使用神经网络结合自然语言处理技术，实现根据申请的文本进行自动分类的效果。为实现上述目的，本专利技术提供以下的技术方案：该基于双向lstm的维修分类系统包括数据的基础清洗工作、文本数据分词及其向量化、模型训练及其评价；其中data目录主要是一些数据存储，包括原始文本数据、jieba分词用的停用词词典等。design_dl_model.py文件是核心网络设计的代码，model_eval.py是模型评价指标的工具类，prepare_data.py是处理原始文本的代码，util.py是整个项目工具类，用于保存一些全局的参数设置，方便进行动态的调整，main.py则是整个项目的入口函数，采用词向量+字向量的双输入，最上层的模型输入由两个分别是左边词向量右边字向量，左右两...

【技术保护点】
1.一种基于双向lstm的维修分类系统，其特征在于：所述基于双向lstm的维修分类系统包括数据的基础清洗工作、文本数据分词及其向量化、模型训练及其评价；其中data目录主要是一些数据存储，包括原始文本数据、jieba分词用的停用词词典，design_dl_model.py文件是核心网络设计的代码，model_eval.py是模型评价指标的工具类，prepare_data.py是处理原始文本的代码，util.py是整个项目工具类，用于保存一些全局的参数设置，方便进行动态的调整，main.py则是整个项目的入口函数，采用词向量+字向量的双输入，最上层的模型输入由两个分别是左边词向量右边字向量，左右两边的处理流程都是一样：第一步确定Embedding层，第二步再对Embedding层分别加上双向LSTM层和Attention层，第三步在LSTM层下面再接一个全连接层。词向量和字向量都按照这三个步骤处理完成之后，再将两边进行拼接，然后下面再加上全连接层和一个Dropout层(用来防止过拟合)，核心网络的核心框架是Keras，最后一层的激活函数采用的是softmax，模型的损失函数是catego...

【技术特征摘要】
1.一种基于双向lstm的维修分类系统，其特征在于：所述基于双向lstm的维修分类系统包括数据的基础清洗工作、文本数据分词及其向量化、模型训练及其评价；其中data目录主要是一些数据存储，包括原始文本数据、jieba分词用的停用词词典，design_dl_model.py文件是核心网络设计的代码，model_eval.py是模型评价指标的工具类，prepare_data.py是处理原始文本的代码，util.py是整个项目工具类，用于保存一些全局的参数设置，方便进行动态的调整，main.py则是整个项目的入口函数，采用词向量+字向量的双输入，最上层的模型输...

【专利技术属性】
技术研发人员：程思铭，
申请(专利权)人：程思铭，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人