【技术实现步骤摘要】
一种基于海量数据的标签化处理及高速检索方法
[0001]本专利技术涉及信息检索
,具体为一种基于海量数据的标签化处理及高速检索方法。
技术介绍
[0002]信息检索是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。狭义的信息检索仅指信息查询。即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。又称信息的存储与检索。一般情况下,信息检索指的就是广义的信息检索。由信息检索原理可知,信息的存储是实现信息检索的基础。这里要存储的信息不仅包括原始文档数据,还包括图片、视频和音频等,首先要将这些原始信息进行计算机语言的转换,并将其存储在数据库中,否则无法进行机器识别。待用户根据意图输入查询请求后,检索系统根据用户的查询请求在数据库中搜索与查询相关的信息,通过一定的匹配机制计算出信息的相似度大小,并按从大到小的顺序将信息转换输出。随着互联网的普及和电子商务的发展,企业和个人 ...
【技术保护点】
【技术特征摘要】
1.一种基于海量数据的标签化处理及高速检索方法,其特征在于:具体按以下步骤执行;S1:首先导入具有标签的分类数据表,并录入各个代表的标签,并对导入数据进行二叉树整理;S2:找到关键字等于查找的数据元素key代号,关键字key小于当前结点,则缩小查找范围到它的左子树,关键字key大于当前结点,则缩小查找范围到它的右子树;S3:从二叉排序树中删除结点p,并重接它的左或者右子树。2.根据权利要求1所述的一种基于海量数据的标签化处理及高速检索方法,其特征在于,如果当前删除的结点,右子树为空,则只需要重新连接左子树;并将结点p临时存储到temp中;并释放需要删除的temp结点。3.根据权利要求2所述的一种基于海量数据的标签化处理及高速检索方法,其特征在于,如果当前删除的结点,左子树为空,则重新连接它的右子树;当删除的当前结点的左右子树均不为空;此...
【专利技术属性】
技术研发人员:于仲阳,
申请(专利权)人:辽宁达因信息服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。