基于RBF神经网络的搜索集群优化方法及系统技术方案

技术编号：13732610 阅读：56 留言：0更新日期：2016-09-21 14:17

本发明专利技术公开了一种基于RBF神经网络的搜索集群优化方法及系统，涉及大数据搜索领域。该系统包括数据节点、管理节点和RBF神经网络训练单元，RBF神经网络训练单元基于RBF神经网络进行搜索集群，将数据节点的索引数量、搜索反馈、搜索CPU消耗、搜索响应时长、节点负载压力等数据，作为输入向量集，定时进行训练与计算，设置自定义误差范围、迭代次数及权值，训练得到最适合自己的簇群及管理节点。当某个管理节点失效，系统自动取出其簇群下失效数据节点的训练结果数据，并找到适合该失效节点的管理节点，在失效数据节点与管理节点之间建立连接请求流程，自动申请加入簇群。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及大数据搜索领域，具体是涉及一种基于RBF神经网络的搜索集群优化方法及系统。
技术介绍
ElasticSearch是一个基于Lucene的搜索服务器。Lucene是apache软件基金会4jakarta项目组的一个子项目，是一个开放源代码的全文检索引擎工具包，即它不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎，部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包，以方便的在目标系统中实现全文检索的功能，或者是以此为基础建立起完整的全文检索引擎。ElasticSearch提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎，设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。ElasticSearch采用Lucene作为其核心，来实现所有索引和搜索的功能。ElasticSearch通过简单的RESTful API，来隐藏Lucene的复杂性，从而让全文搜索变得简单。下面简单介绍一些ElasticSearch的相关术语。全文检索：不同于传统的模糊匹配，其先对搜索词按一定规则分词后，再将分词与源数据进行匹配，根据出现分词次数，分词邻近距离，权重等数据进行打分，获得检索结果。搜索节点：单个ElasticSearch服务器节点。管理节点：ElasticSearch的master节点，用于管理集群数据同步，消息分发...

【技术保护点】
一种基于RBF神经网络的搜索集群优化方法，其特征在于，包括以下步骤：S1、以数据节点的索引数量、搜索反馈、搜索CPU消耗、搜索响应时长、节点负载压力数据作为训练样本集，进行RBF神经网络训练，匹配最优的管理节点，得到失效的数据节点，向合适的管理节点发送申请加入簇群的请求；S2、判断管理节点在规定时长内是否有响应，若该管理节点在规定时长内无响应，则返回步骤S1，对失效的数据节点重新进行RBF神经网络训练；若该管理节点在规定时长内有响应，则转到步骤S3；S3、管理节点对当前簇群的数据节点数量进行分析，判断簇群的数据节点数量是否达到上限，若达到上限，则返回步骤S1，对失效的数据节点重新进行RBF神经网络训练；若未达到上限，则转到步骤S4；S4、管理节点向申请加入的数据节点回复请求，与该数据节点建立连接，并通知整个搜索集群。

【技术特征摘要】
1.一种基于RBF神经网络的搜索集群优化方法，其特征在于，包括以下步骤：S1、以数据节点的索引数量、搜索反馈、搜索CPU消耗、搜索响应时长、节点负载压力数据作为训练样本集，进行RBF神经网络训练，匹配最优的管理节点，得到失效的数据节点，向合适的管理节点发送申请加入簇群的请求；S2、判断管理节点在规定时长内是否有响应，若该管理节点在规定时长内无响应，则返回步骤S1，对失效的数据节点重新进行RBF神经网络训练；若该管理节点在规定时长内有响应，则转到步骤S3；S3、管理节点对当前簇群的数据节点数量进行分析，判断簇群的数据节点数量是否达到上限，若达到上限，则返回步骤S1，对失效的数据节点重新进行RBF神经网络训练；若未达到上限，则转到步骤S4；S4、管理节点向申请加入的数据节点回复请求，与该数据节点建立连接，并通知整个搜索集群。2.如权利要求1所述的基于RBF神经网络的搜索集群优化方法，其特征在于：步骤S1中进行RBF神经网络训练的过程中，基于RBF神经网络进行搜索集群，选择若干个径向基函数，每个径向基函数对应一个训练数据。3.如权利要求2所述的基于RBF神经网络的搜索集群优化方法，其特征在于：所述径向基函数的插值函数的公式如下：其中，X是输入，输入的次数是m，m为正整数；P是径向基函数的数量，P为正整数，且P>m；输入X是个m维的向量，样本容量为P；Xp是第P次输入，是第P个径向基函数，Xp是径向基函数的中心；ωP是第P个权值向量，(||X-Xp||)表示差向量的模；y是输出的训练结果。4.如权利要求3所述的基于RBF神经网络的搜索集群优化方法，其特征在于：步骤S1中进行RBF神经网络训练的过程中，将数据节点的索引数量、搜索反馈、搜索CPU消耗、搜索响应时长、节点负载压力数据，作为输入向量集，定时进行训练与计算，设置自定义误差范围、迭代次数及权值，训练得到最适合自己的簇群及管理节点。5.如权利要求4所述的基于RBF神经网络的搜索集群优化方法，其特征在于：当某个管理节点失效，自动取出其簇群下失效数据节点的训练结果数据，并找到适合该失效节点的管理节点，在失效数据节点与管理节点之间建立连接请求流程，自动申请加入簇群，簇群节点上限数为自定义。6.一种基于RBF神经网络的搜索集群优化系统，其...

【专利技术属性】
技术研发人员：白凡，
申请(专利权)人：武汉斗鱼网络科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人