一种铁路安监数据处理方法、系统、装置和存储介质制造方法及图纸

技术编号：26223183 阅读：29 留言：0更新日期：2020-11-04 10:55

本发明专利技术公开了一种铁路安监数据处理方法、系统、装置和存储介质，铁路安监数据处理方法包括获取TextCNN模型，将铁路安监数据分别进行多种词嵌入处理；各词嵌入处理的种类数与TextCNN模型的通道数量相匹配，各词嵌入处理分别产生一个第一词向量，将各第一词向量输入到TextCNN模型，以及获取TextCNN模型的输出结果等步骤。使用经过训练的TextCNN模型对自然语言文本形式的铁路安监数据进行分类和整理，具有较高的效率和较低的出错率，可以应对海量铁路安监数据，能够挖掘出日常安全管理工作中积累的原始记录信息，对后续总结安监工作、汲取历史经验具有重要价值。本发明专利技术广泛应用于自然语言处理技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种铁路安监数据处理方法、系统、装置和存储介质
本专利技术涉及自然语言处理
，尤其是一种铁路安监数据处理方法、系统、装置和存储介质。
技术介绍
铁路路网规模的不断扩张和新技术新设备大量投入使用，给铁路运输安全带来新的挑战，确保铁路生产和旅客安全已经上升到国家安全发展的战略高度。在铁路安监领域，安监工作会产生铁路安监风险问题字典库和铁路发牌问题描述记录等铁路安监数据，这些铁路安监数据中包含了日常安全管理工作中积累的原始记录信息，对后续总结安监工作、汲取历史经验具有重要价值。铁路安监数据是以自然语言文本的方式展现的，现有技术中是由人工对铁路安监数据进行分类和整理，但是人工操作的低效率和高出错率难以应对实际生产中的海量铁路安监数据。
技术实现思路
针对上述至少一个技术问题，本专利技术的目的在于提供一种铁路安监数据处理方法、系统、装置和存储介质。一方面，本专利技术实施例包括一种铁路安监数据处理方法，包括以下步骤：获取TextCNN模型；所述TextCNN模型有多个通道；将所述铁路安监数据分别进行多种词嵌入处理；各所述词嵌入处理的种类数与所述TextCNN模型的通道数量相匹配，各所述词嵌入处理分别产生一个第一词向量；将各所述第一词向量输入到所述TextCNN模型；获取所述TextCNN模型的输出结果。进一步地，所述铁路安监数据包括铁路安监风险问题字典库和/或铁路发牌问题描述记录。进一步地，铁路安监数据处理方法还包括以下步骤：使用Jieba...

【技术保护点】
1.一种铁路安监数据处理方法，其特征在于，包括以下步骤：/n获取TextCNN模型；所述TextCNN模型有多个通道；/n将所述铁路安监数据分别进行多种词嵌入处理；各所述词嵌入处理的种类数与所述TextCNN模型的通道数量相匹配，各所述词嵌入处理分别产生一个第一词向量；/n将各所述第一词向量输入到所述TextCNN模型；/n获取所述TextCNN模型的输出结果。/n

【技术特征摘要】
1.一种铁路安监数据处理方法，其特征在于，包括以下步骤：
获取TextCNN模型；所述TextCNN模型有多个通道；
将所述铁路安监数据分别进行多种词嵌入处理；各所述词嵌入处理的种类数与所述TextCNN模型的通道数量相匹配，各所述词嵌入处理分别产生一个第一词向量；
将各所述第一词向量输入到所述TextCNN模型；
获取所述TextCNN模型的输出结果。

2.根据权利要求1所述的铁路安监数据处理方法，其特征在于，所述铁路安监数据包括铁路安监风险问题字典库和/或铁路发牌问题描述记录。

3.根据权利要求1所述的铁路安监数据处理方法，其特征在于，还包括以下步骤：
使用Jieba分词算法对所述铁路安监数据进行分词处理；
对所述铁路安监数据进行去停用词处理；
确定所述铁路安监数据的标签；所述标签用于对所述铁路安监数据进行车务二级分类、车务三级分类或车务四级分类。

4.根据权利要求1所述的铁路安监数据处理方法，其特征在于，所述TextCNN模型经过以下训练：
将所述铁路安监数据分别进行多种词嵌入处理；各所述词嵌入处理的种类数与所述TextCNN模型的通道数量相匹配，各所述词嵌入处理分别产生一个第二词向量；
获取部分或全部所述第二词向量以组成训练数据集和测试数据集；
设置所述TextCNN模型训练参数；
将所述训练数据集和测试数据集作为所述TextCNN模型的输入数据，将所述训练数据集和测试数据集中的所述第二词向量对应的所述标签作为所述TextCNN模型的期望输出，执行对所述TextCNN模型的训练。

5.根据权利要求4所述的铁路安监数据处理方法，其特征在于，所述训练参数包括批量大小、迭代次...

【专利技术属性】
技术研发人员：凌政，董选明，
申请(专利权)人：广州忘平信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人