一种基于鲸鱼优化算法的大数据智能搜索方法及系统技术方案

技术编号:17939753 阅读:294 留言:0更新日期:2018-05-15 20:08
本发明专利技术公开了一种基于鲸鱼优化算法的大数据智能搜索方法及系统,利用鲸鱼优化算法对大数据智能搜索问题优化求解,从而快速地获得最接近用户需求的搜索结果,进一步提高智能搜索引擎的正确率和效率;本发明专利技术能够在可接受的时间代价内找到大数据智能搜索问题高质量的可行解,根据用户的搜索条件,从引擎数据库中得到和用户输入关键词相关的大数据,由用户不断地对搜索结果打分,逐步得到满足用户个性化的需求的搜索效果。本发明专利技术利用鲸鱼优化算法进行大数据智能搜索,基于本体特征建立了一个具有智能化的搜索引擎,快速高效地找到最符合用户需要的搜索结果,解决了当前搜索引擎不能很好地为用户提供感兴趣信息的问题且搜索效率高。

An intelligent search method and system for big data based on whale optimization algorithm

The invention discloses a large data intelligent search method and system based on the whale optimization algorithm, and uses the whale optimization algorithm to optimize the intelligent search problem of large data, thus quickly obtains the search results closest to the user needs, and further improves the accuracy and efficiency of the intelligent search engine. In the time cost, the high quality and feasible solution of the large data intelligent search problem is found. According to the user's search conditions, the large data related to the user input key words are obtained from the engine database, and the users are constantly scoring the search results, and the search results satisfying the user's individualized demand are gradually obtained. This invention uses the whale optimization algorithm to search the large data intelligently. Based on the ontology features, an intelligent search engine is built to quickly and efficiently find the search results most in accordance with the needs of the user. It solves the problem that the current search engine can not provide the users with the interest information well and the search efficiency is high.

【技术实现步骤摘要】
一种基于鲸鱼优化算法的大数据智能搜索方法及系统
本专利技术属于大数据和智能计算的交叉应用领域,涉及一种智能优化算法在大数据领域的应用,尤其涉及一种在大数据智能搜索问题上的解决方法,具体涉及一种基于鲸鱼优化算法的大数据智能搜索方法及系统。
技术介绍
近几年,大数据在全球得到了迅猛发展,同时引起了学术、业界以及各国政府的高度重视。通过有效地管理大数据并通过分析获取其价值,能够提供高附加值的应用和服务,实现更多的经济和社会价值。但是,大数据时代的来临,既带来了重大的发展机遇又带来了技术挑战。传统的计算技术在解决大数据问题处理时会面临诸多的技术困难。因此,需要研究和寻找新的有效技术方法,以完成大数据的分析处理和价值发现。不同于传统的数据库查询,网络搜索的一个特点是,用户往往不能一下子完全表达自己的需求,而是通过和搜索引擎的多次交互、逐步逼近,才能基本达到用户请求的目标。这样会导致效率很低。搜索系统能够在用户第一次提出查询请求时,就通过大数据分析洞察其含义,对查询表达式自动做语义扩展,一次中的就可大大提高效率,减轻用户负担。网络搜索引擎是网上信息查询的一个有力的工具,是网络信息检索的关键技术。传统搜索引擎主要包括:目录类搜索引擎、全文搜索引擎、元搜索引擎、集合式搜索引擎和垂直搜索引擎。随着信息格式的多样化和信息数量的激增,传统搜索引擎面临着巨大的挑战,它已经不能满足用户更个性化、智能化以及多样化的需要。从信息的搜集到信息的组织与索引以及信息的检索与用户接口,智能搜索引擎在不断优化传统搜索引擎的各个方面。智能搜索引擎主要包括:基于本体的智能搜索引擎、基于知识库系统的智能搜索引擎和基于语义关联的智能搜索引擎。智能搜索引擎是将基于关键词层面检索的传统搜索引擎提高到基于知识或概念层面来检索的搜索引擎,它可以从知识和概念的角度来理解词语,表现出较强的智能化与个性化特色,它以一定的知识库技术基础,具有很高的自然语言理解与知识处理能力。大数据搜索引擎经过了20多年的发展,在搜索速度及正确率都有较大的改善,但是其基本架构和技术都没有太大的改变,这也就造成了它的局限性。针对不同应用场合的搜索引擎,需要的信息也是千差万别的。非智能化检索缺乏识别用户感兴趣信息的能力,并且排序方式不能根据不同使用者做出相应的调整。为不同的人提供具有针对性的检索服务,是未来搜索引擎发展的道路之一,因而各种智能化搜索技术由此诞生。人工智能和计算智能等学科的诞生,是研究者们试图从人类思维和生物界的一些规律中得到启发,创建相应的计算模型,应用到信息科学中去。人工神经网络、群体智能、基因计算等都是运用到当前大数据挑战中的一些成功范例。结合本体特征来建立一个具有智能化的搜索引擎,既解决了目前搜索引擎不能很好地为用户提供感兴趣信息的问题,同时还提高了搜索效率。
技术实现思路
为了解决大数据智能搜索问题,本专利技术提出了一种基于鲸鱼优化算法的大数据智能搜索方法及系统。本专利技术的方法所采用的技术方案是:一种基于鲸鱼优化算法的大数据智能搜索方法,其特征在于,包括以下步骤:步骤1:读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置Xi,初始化鲸群的位置:n表示维度,N表示鲸群大小;步骤2:初始化鲸鱼优化算法所需的参数,包括鲸群大小N,对数螺旋形状常数b,当前迭代次数j,最大迭代次数M,整个鲸群全局最优位置为G;步骤3:计算鲸鱼优化算法中鲸群的初始位置的适应度函数值,将适应度函数值评价最高的大数据作为当前鲸群个体最佳空间位置步骤4:计算系数向量A和C;步骤5:产生一个取值范围为[0,1]的随机数p,并根据p的取值选择不同的更新鲸群空间位置的方式;步骤6:将更新后鲸群的位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分,作为适应度函数值;找到并保存当前群体中最佳鲸群个体X*;步骤7:通过比较更新前后鲸群的位置向量对应的适应度函数值,确定下一代鲸群的位置;步骤8:记录符合度最高的大数据对应的鲸群位置为全局最优解G以及其适应度函数值;步骤9:判断用户是否在引擎中找到了需要的文本文档;若否,则令j=j+1并回转执行步骤4;若是,则输出最优鲸群个体适应度值及所处的位置X*对应的大数据。本专利技术的系统所采用的技术方案是:其特征在于:包括输入模块、鲸鱼优化算法初始化模块、适应度函数值模块、系数向量计算模块、鲸群空间位置更新方式选择模块、更新后的鲸群空间位置向量适应度值计算模块、下一代鲸群的位置确定模块、鲸群位置为全局最优解G以及其适应度函数值记录模块、判断模块;所述输入模块:用于读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置Xi,初始化鲸群的位置:n表示维度,N表示鲸群大小;所述鲸鱼优化算法初始化模块:用于初始化鲸鱼优化算法所需的参数,包括鲸群大小N,对数螺旋形状常数b,当前迭代次数j,最大迭代次数M,整个鲸群全局最优位置为G;所述适应度函数值模块:用于计算鲸鱼优化算法中鲸群的初始位置的适应度函数值,将适应度函数值评价最高的大数据作为当前鲸群个体最佳空间位置所述系数向量计算模块:用于计算系数向量A和C;所述鲸群空间位置更新方式选择模块:用于产生一个取值范围为[0,1]的随机数p,并根据p的取值选择不同的更新鲸群空间位置的方式;所述更新后的鲸群空间位置向量适应度值计算模块:用于将更新后鲸群的位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分,作为适应度函数值;找到并保存当前群体中最佳鲸群个体X*;所述下一代鲸群的位置确定模块:用于通过比较更新前后鲸群的位置向量对应的适应度函数值,确定下一代鲸群的位置;所述鲸群位置为全局最优解G以及其适应度函数值记录模块:用于记录符合度最高的大数据对应的鲸群位置为全局最优解G以及其适应度函数值;所述判断模块:用于判断用户是否在引擎中找到了需要的文本文档;若否,则令j=j+1并回转执行步骤4;若是,则输出最优鲸群个体适应度值及所处的位置X*对应的大数据。本专利技术的有益效果是:鲸鱼优化算法具有调节参数少、收敛速度快、寻优精度高、全局寻优能力强以及收敛稳定性好的特点,利用鲸鱼优化算法对大数据智能搜索问题优化求解,从而快速地获得最接近用户需求的搜索结果,具有良好的正确率和效率。附图说明图1是本专利技术实施例的方法流程图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种基于鲸鱼优化算法的大数据智能搜索方法,包括以下步骤:步骤1:读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置Xi,初始化鲸群的位置:n表示维度,N表示鲸群大小;步骤2:设置鲸鱼优化算法所需的参数,所述的初始化鲸鱼优化算法所需的参数包括鲸群大小N,对数螺旋形状常数b,当前迭代次数j,最大迭代次数M,整个鲸群全局最优位置为G。步骤3:将鲸鱼优化算法中本文档来自技高网
...
一种基于鲸鱼优化算法的大数据智能搜索方法及系统

【技术保护点】
一种基于鲸鱼优化算法的大数据智能搜索方法,其特征在于,包括以下步骤:步骤1:读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置Xi,初始化鲸群的位置:

【技术特征摘要】
1.一种基于鲸鱼优化算法的大数据智能搜索方法,其特征在于,包括以下步骤:步骤1:读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置Xi,初始化鲸群的位置:i=1,2,...,N,n表示维度,N表示鲸群大小;步骤2:初始化鲸鱼优化算法所需的参数,包括鲸群大小N,对数螺旋形状常数b,当前迭代次数j,最大迭代次数M,整个鲸群全局最优位置为G;步骤3:计算鲸鱼优化算法中鲸群的初始位置的适应度函数值,将适应度函数值评价最高的大数据作为当前鲸群个体最佳空间位置步骤4:计算系数向量A和C;步骤5:产生一个取值范围为[0,1]的随机数p,并根据p的取值选择不同的更新鲸群空间位置的方式;步骤6:将更新后鲸群的位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分,作为适应度函数值;找到并保存当前群体中最佳鲸群个体X*;步骤7:通过比较更新前后鲸群的位置向量对应的适应度函数值,确定下一代鲸群的位置;步骤8:记录符合度最高的大数据对应的鲸群位置为全局最优解G以及其适应度函数值;步骤9:判断用户是否在引擎中找到了需要的文本文档;若否,则令j=j+1并回转执行步骤4;若是,则输出最优鲸群个体适应度值及所处的位置X*对应的大数据。2.根据权利要求1所述的基于鲸鱼优化算法的大数据智能搜索方法,其特征在于:步骤3中,适应度函数值计算方式为将鲸群的位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分。3.根据权利要求1所述的基于鲸鱼优化算法的大数据智能搜索方法,其特征在于,步骤4中所述系数向量A的计算公式为:A=2a×r-a其中,r为取值范围在[0,1]之间的随机向量。4.根据权利要求1所述的基于鲸鱼优化算法的大数据智能搜索方法,其特征在于,步骤4中所述系数向量C的计算公式为:C=2r其中,r为随机向量,取值范围为[0,1]。5.根据权利要求1所述的基于鲸鱼优化算法的大数据智能搜索方法,其特征在于,步骤5中所述更新鲸群空间位置的方式:当p<0.5时,若A<1,更新当前鲸群个体的空间位置的公式为:Xj+1=Xj-A×D其中,j为当前的迭代次数,Xj为当前鲸群个体空间位置,A和C为系数向量,为当前鲸群个体最佳空间位置;当p<0.5时,若A≥1,则从当前群体中随机选择鲸群个体位置Xrand,并更新当前鲸群个体的空间位置;更新当前鲸群个体的空间位置公式为:X=Xrand-A×DD=|C×Xrand,j-Xj|其中,Xran...

【专利技术属性】
技术研发人员:叶志伟杨娟王春枝王若曦胡志勇金灿徐萍谭敏郑逍孙一恒侯亚君
申请(专利权)人:湖北工业大学武汉烽火技术服务有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1