面向新型供电城轨列车数据运维的自然语言查询解析方法技术

技术编号：23190903 阅读：72 留言：0更新日期：2020-01-24 16:15

本发明专利技术公开了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。新型供电城轨列车运行时采集获得的运维数据存储于数据库中，组建一条运维数据的训练样本；对运维数据的自然语言查询和字段进行嵌入处理；将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练；将待测试的自然语言查询语句处理成输入向量，通过训练后的两个不同神经网络模型映射到，对结构化查询语句的不同分类部分进行预测输出，预测后再组合合并成完整的预测结果。本发明专利技术利用了数据库已存储的大规模数据扩充训练样本，在获取成本低、存储代价小、使用效率高的基础上，丰富了模型学习到的语义信息，提升了对结构化查询语句的预测准确率。

全部详细技术资料下载

【技术实现步骤摘要】
面向新型供电城轨列车数据运维的自然语言查询解析方法
本专利技术涉及计算机机器学习领域中的语言数据查询方法，尤其是涉及了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。
技术介绍
在新型供电城轨列车运维系统中，对所存储的数据进行查询是最频繁也是最重要的操作。传统的查询方式需要精通数据库查询语法的用户为每一个查询编写结构化查询语句，随着业务规模的扩大和人工智能技术的发展，现代的个性化运维系统对使用自然语言的查询方式提出了迫切的需求。与传统查询方式相比，通过对自然语言查询进行解析，把自然语言转换为结构化查询语句，能够使用户在不需要了解数据具体存储方式的情况下快速地实现查询意图。这种自然语言查询解析技术能够大大地提高新型城轨列车个性化运维系统的查询便利性和使用效率，在业务数据规模不断扩大的背景下，使个性化运维系统为大数据的管理和使用提供更好的支撑。近年来，随着人工智能技术的快速发展，自然语言查询的解析方法集中在神经网络领域。这类方法一般将自然语言查询和数据库的字段名称进行词嵌入表示作为模型输入，通过序列-序列或者序列...

【技术保护点】
1.一种面向新型供电城轨列车数据运维的自然语言查询解析方法，其特征在于：方法的步骤如下：/n(1)新型供电城轨列车运行时采集获得的运维数据存储于数据库中，由运维数据的一个自然语言查询语句以及该自然查询语句所对应的一个结构化查询语句组建一条运维数据的训练样本，自然语言查询语句包含有字段，每种字段具有多个属性值；对于每条训练样本，将自然语言查询语句中出现的每个字段的属性值替换为同种字段的其他属性值，并同样对结构化查询语句做相同替换，由此重复多次形成一批训练样本，完成对训练样本的扩展；/n(2)针对新型供电城轨列车运行时采集获得的运维数据，对运维数据的自然语言查询和字段进行嵌入处理：对自然语言查询语...

【技术特征摘要】
1.一种面向新型供电城轨列车数据运维的自然语言查询解析方法，其特征在于：方法的步骤如下：
(1)新型供电城轨列车运行时采集获得的运维数据存储于数据库中，由运维数据的一个自然语言查询语句以及该自然查询语句所对应的一个结构化查询语句组建一条运维数据的训练样本，自然语言查询语句包含有字段，每种字段具有多个属性值；对于每条训练样本，将自然语言查询语句中出现的每个字段的属性值替换为同种字段的其他属性值，并同样对结构化查询语句做相同替换，由此重复多次形成一批训练样本，完成对训练样本的扩展；
(2)针对新型供电城轨列车运行时采集获得的运维数据，对运维数据的自然语言查询和字段进行嵌入处理：对自然语言查询语句中出现的属于字段属性值的词进行标记，按照不同种字段对应的词映射为不同的类型向量，同一种字段对应的词映射为同一类型向量；同时对自然语言查询语句中每个字段属性值的词处理获得第一词向量；对数据库中每种字段属性值的词的第一词向量进行平均处理获得平均词向量作为该种字段的内容向量，对每个字段的词处理获得第二词向量；最后将自然语言查询语句中每个类型向量以及数据库中每种字段的内容...

【专利技术属性】
技术研发人员：吴晓凡，刘晋，潘硕，李辉，田野，陈刚，陈珂，江大伟，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人