基于自然语言处理的自助式查询统计分析方法技术

技术编号:17516512 阅读:75 留言:0更新日期:2018-03-21 01:06
本发明专利技术公开了一种基于自然语言处理的自助式查询统计分析方法,包括:构建电力通信数据查询统计分析规则库、知识库、语料库;建立电力通信标准化、程序化的多维数据查询统计分析模型;输入查询统计分析语句或段落,形成查询统计分析自然语言处理任务,生成语义依存树;将语义依存树中各元素对应到查询统计分析模型中,通过规则库与知识库匹配生成结构化查询语句,最终生成查询统计分析结果集。本发明专利技术不但支持可自定义、快速灵活的数据配置、处理、分析和管理,还能实现通信网自动化、智能化规划、设计、运维水平。

Statistical analysis method of self-service query based on Natural Language Processing

The invention discloses a method of statistical analysis, including Natural Language Processing self-service query based on statistical analysis: to construct the rule base, knowledge base, corpus power communication data query; statistical analysis of multidimensional data model establishment and procedure of power communication standard query; query statistical analysis statement or paragraphs, the formation of the query and the analysis of Natural Language Processing task. The semantic dependency tree; semantic dependency tree will each element corresponding to the query and statistical analysis model, the rule base and knowledge base, generating structured query, query and statistical analysis results in the final generation. The invention not only supports customizable, fast and flexible data configuration, processing, analysis and management, but also realizes automation, intelligent planning, design, operation and maintenance level of communication network.

【技术实现步骤摘要】
基于自然语言处理的自助式查询统计分析方法
本专利技术涉及一种基于自然语言处理的自助式查询统计分析方法,属于电力通信

技术介绍
目前通信专业数据查询统计分析实际应用过程中,主要依赖现有的电子文档、通信管理系统固化的查询统计条件输出数据分析结果,或通过商业智能(BI)决策系统由业务人员提出查询统计需求,厂家技术人员在决策系统中经过复杂的人工处理输出用户所需的数据分析结果,这种供应者/使用者式的商业智能方法虽然似乎能够胜任集中组织数据并提升一致性的任务,但它牺牲了业务敏捷性和灵活性,解决问题的时间严重滞后于提出问题的时间,分析过程中这种延迟和敏捷性的缺乏导致采纳情况欠佳,同时缺乏用户灵活多变的数据分析处理快速响应能力,用户体验差,效率低下。
技术实现思路
本专利技术的目的在于克服现有技术中的不足,提供一种基于自然语言处理的自助式查询统计分析方法,解决现有技术中电力通信数据查询统计分析存在延迟、缺乏敏捷性、用户体验差、效率低的技术问题。为解决上述技术问题,本专利技术所采用的技术方案是:基于自然语言处理的自助式查询统计分析方法,包括如下步骤:构建电力通信数据查询统计分析规则库、知识库、语料库;建立电力通信标准化、程序化的多维数据查询统计分析模型;输入查询统计分析语句或段落,形成查询统计分析自然语言处理任务,生成语义依存树;将语义依存树中各元素对应到查询统计分析模型中,通过规则库与知识库匹配生成结构化查询语句,最终生成查询统计分析结果集。构建电力通信数据查询统计分析规则库、知识库、语料库的具体方法如下:对电力通信数据进行分析和归纳总结,梳理各种数据要素,结合各种标准规范、自然语言处理、多维统计分析模型的需求,生成规则库、知识库和语料库;所述数据要素包括:数据表、数据分类、数据字段、关联关系、数据字典、数据类型;所述标准规范包括:资源命名规范、功能规范和资源信息模型规范。建立电力通信标准化、程序化的多维数据查询统计分析模型的具体方法如下:结合数据库操作和算法的特征,将查询统计分析归纳抽象为固定因素的组合,将所述组合标准化、程序化即得到多维数据查询统计分析模型;所述固定因素包括:对象、条件、维度、方法、范围、频度。采用文字方式输入查询统计分析语句或段落。生成语义依存树的具体方法如下:将所述自然语言处理任务发送至语义识别服务,处理输入的语句或段落,对其业务含义按照名词偏正词组语法规则精确定义,进行从底层到高层的一系列分析:包括词法分析、句法分析、底层语义分析、高层语义分析,通过与语料库匹配结合,自动生成语义依存树。生成查询统计分析结果集的具体方法为:查询统计分析模型将语义依存树中的各因素转化为查询统计的对象、字段、条件、计算方法,通过乘积空间聚类规则、正则匹配规则、矢量量化竞争学习多层神经网络算法、Rabin-Karp算法等规则和算法,转化为数据库查询语句或程序算法,执行数据库操作和算法,即得到查询统计分析结果集。查询统计分析结果集通过可视化图表组件输出展示。与现有技术相比,本专利技术所达到的有益效果是:结合人工智能自然语言处理方法的优点并克服缺乏用户灵活多变的数据分析处理快速响应能力的缺点,以电力通信数据自然语言处理技术为核心,并辅以电力通信数据查询统计分析规则库、知识库、语料库,不但支持可自定义、快速灵活的数据配置、处理、分析和管理,还能实现通信网自动化、智能化规划、设计、运维水平,客户可以在客户端输入查询统计分析语句或段落,便可实时直观地读取统计结果,确保电力系统安全稳定的运行具有重要的实际意义。附图说明图1是本专利技术的流程图;图2是自然语言处理技术的功能示意图;图3是标准化、程序化的多维数据查询统计分析模型的功能示意图;图4是江苏省各变电站采用本专利技术的过程示意图。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。如图1所示,是本专利技术的流程图,具体包括如下步骤:构建电力通信数据查询统计分析规则库、知识库、语料库;对电力通信数据进行分析和归纳总结,梳理各种数据要素,结合各种标准规范、自然语言处理、多维统计分析模型的需求,生成规则库、知识库和语料库;所述数据要素包括:数据表、数据分类、数据字段、关联关系、数据字典、数据类型;所述标准规范包括:资源命名规范、功能规范和资源信息模型规范。通过专业语料库和知识库的生成,可以大幅提高自然语言处理的准确性;通过规则库、知识库的建立,可以将语义分析的结果准确的匹配到查询统计分析模型中,为后续多维数据集的生成和可视化展现打下基础。建立电力通信标准化、程序化的多维数据查询统计分析模型;结合数据库操作和算法的特征,将查询统计分析归纳抽象为固定因素的组合,将所述组合标准化、程序化即得到多维数据查询统计分析模型;所述固定因素包括:对象、条件、维度、方法、范围、频度。采用文字方式输入查询统计分析语句或段落,形成查询统计分析自然语言处理任务,生成语义依存树;如图2所示,是自然语言处理技术的功能示意图。将自然语言处理任务发送至语义识别服务,处理输入的语句或者段落(篇章),对其业务含义按照严格的名词偏正词组语法规则精确定义,进行从底层到高层的一系列分析,包括词法分析(中文分词、词性标注、实体识别)、句法分析(依存分析)、底层语义分析(语义依存树分析)、高层语义分析(文本分类、文本转换、自动摘要、情感分析),通过与领域词典(语料库)匹配结合,自动生成语义依存树。将语义依存树中各元素对应到查询统计分析模型中,通过规则库与知识库匹配生成结构化查询语句,最终生成查询统计分析结果集并输出展示。如图3所示,是标准化、程序化的多维数据查询统计分析模型的功能示意图。通过与知识库、规则库的匹配,可以将自然语言处理生成的语义依存树中各元素对应到分析模型中,查询统计分析模型将语义依存树中的各因素转化为查询统计的对象、字段、条件、计算方法,通过乘积空间聚类规则、正则匹配规则、矢量量化竞争学习多层神经网络算法、Rabin-Karp算法等规则和算法,转化为数据库查询语句或程序算法,执行数据库操作和算法,即得到查询统计分析结果集。查询统计分析结果集通过可视化图表组件输出展示:可视化图表组件依据数据集已匹配的多维数据查询统计分析模型自动推荐最佳可视化图表展示方案,并提供多套展示方案供用户选择,数据集被可视化组件自动读取,实现查询统计分析处理结果的直观、可交互、可高度个性化定制的可视化展示。如图4所示,是江苏省各变电站采用本专利技术的过程示意图。成果的运用可以有效降低电网管理的运行维护成本,减少人力、时间的投入,全方位支撑公司电网生产、经营管理、优质服务等业务的精益化管理,为电网的设备运维、企业管理与客服服务提供全过程自助式数据决策技术支撑,提高工作效率、管理水平和客户满意,推动企业智能化水平提升。以上所述仅是本专利技术的优选实施方式,应当指出,对于本
的普通技术人员来说,在不脱离本专利技术技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本专利技术的保护范围。本文档来自技高网
...
基于自然语言处理的自助式查询统计分析方法

【技术保护点】
基于自然语言处理的自助式查询统计分析方法,其特征在于,包括如下步骤:构建电力通信数据查询统计分析规则库、知识库、语料库;建立电力通信标准化、程序化的多维数据查询统计分析模型;输入查询统计分析语句或段落,形成查询统计分析自然语言处理任务,生成语义依存树;将语义依存树中各元素对应到查询统计分析模型中,通过规则库与知识库匹配生成结构化查询语句,最终生成查询统计分析结果集。

【技术特征摘要】
1.基于自然语言处理的自助式查询统计分析方法,其特征在于,包括如下步骤:构建电力通信数据查询统计分析规则库、知识库、语料库;建立电力通信标准化、程序化的多维数据查询统计分析模型;输入查询统计分析语句或段落,形成查询统计分析自然语言处理任务,生成语义依存树;将语义依存树中各元素对应到查询统计分析模型中,通过规则库与知识库匹配生成结构化查询语句,最终生成查询统计分析结果集。2.根据权利要求1所述的基于自然语言处理的自助式查询统计分析方法,其特征在于,构建电力通信数据查询统计分析规则库、知识库、语料库的具体方法如下:对电力通信数据进行分析和归纳总结,梳理各种数据要素,结合各种标准规范、自然语言处理、多维统计分析模型的需求,生成规则库、知识库和语料库;所述数据要素包括:数据表、数据分类、数据字段、关联关系、数据字典、数据类型;所述标准规范包括:资源命名规范、功能规范和资源信息模型规范。3.根据权利要求1所述的基于自然语言处理的自助式查询统计分析方法,其特征在于,建立电力通信标准化、程序化的多维数据查询统计分析模型的具体方法如下:结合数据库操作和算法的特征,将查询统计分析归纳抽象为固定因素的组合,将所述组合标准化、程序化即得到多维数据...

【专利技术属性】
技术研发人员:魏训虎陆涛查凡吴德胜吴选章王宏丁雍巢玉坚胡游君邱玉祥施健马远东蔡新忠杨旭斌王锦杰刘皓刘洋夏云邓伟黄峰王泉啸甘岚
申请(专利权)人:南京南瑞集团公司南京南瑞信息通信科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1