基于分类器与密度聚类算法的租房信息检索方法及系统技术方案

技术编号:34851281 阅读:31 留言:0更新日期:2022-09-08 07:51
本发明专利技术提供了基于分类器与密度聚类算法的租房信息检索方法及系统,包括:采集网络上的租房信息;将租房信息按照特征的相似度进行聚类分析,在每一次的聚类过程中进行数据点之间的距离计算获得特征值,并且使用密度聚类的方式将相似度较高的租房信息归类为一个群组形成聚类区域;通过分类器建立租房信息的特征值与聚类区域之间的映射关系;获取目标用户的租房条件信息,获取租房条件信息的特征值并输入分类器,根据映射关系获取租房条件信息的特征值所对应的聚类区域,获取聚类区域内的租房信息;进一步地降低检索的时间复杂度,解决了租房信息检索过程中信息检索数据冗长,检索复杂,获取数据时间长,精度低的技术问题。精度低的技术问题。精度低的技术问题。

【技术实现步骤摘要】
基于分类器与密度聚类算法的租房信息检索方法及系统


[0001]本专利技术属于租房信息检索
,具体涉及到基于分类器与密度聚类算法的租房信息检索方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]数据检索是计算机领域中最为基础的问题,其目的是在整个数据集范围内查询符合给定关键字条件的特定数据。数据检索的效率取决于整个数据集的长度以及检索策略的设计。
[0004]对于容量较小的数据集,可以采用逐步遍历比较的方式查找出符合给定条件的特定数据。此外,与树或图相关的结构也可以实现检索过程的加速,从而以更高的效率查找数据。然而,近年来随着电子信息业务的发展,待处理的业务类数据呈TB级增长,普通的优化算法已经不能满足海量且结构复杂的数据检索需求。
[0005]因此,相关的深度学习以及大数据相关的数据处理算法应运而生,深度学习类的相关技术旨在建立一种能够满足任务需求的函数,而该函数能够自发地根据给定的输入或输出结果对自身的参数进行优化。此外,数据挖掘相关的技术旨在发现数据之间的显式或隐式联系,并且采用一定的方式对数据进行整理,以加速数据检索或计算的过程。
[0006]同理,在社区租房的应用场景中,也需要应用上述相关技术优化租房信息的检索过程。而现有的租房信息检索过程存在信息检索数据冗长、检索复杂、数据获取时间长、精度低等主要问题,无法有效满足用户的使用需求。因此,如何利用深度学习与大数据相关技术,提高租房信息的检索效率和精度,是目前需要解决的技术难题。

技术实现思路

[0007]本专利技术为了解决上述问题,提出了基于分类器与密度聚类算法的租房信息检索方法及系统,以缩短信息检索的长度,从而进一步地降低检索的时间复杂度。
[0008]第一方面,本专利技术采用如下技术方案:基于分类器与密度聚类算法的租房信息检索方法,包括:
[0009]采集网络上的租房信息;
[0010]将租房信息按照特征的相似度进行聚类分析,在每一次的聚类过程中进行数据点之间的距离计算获得特征值,并且使用密度聚类的方式将相似度较高的租房信息归类为一个群组形成聚类区域;
[0011]通过分类器建立租房信息的特征值与聚类区域之间的映射关系;
[0012]获取目标用户的租房条件信息,获取租房条件信息的特征值并输入分类器,根据映射关系获取租房条件信息的特征值所对应的聚类区域,获取聚类区域内的租房信息。
[0013]所述租房信息包括租房信息数据和租房条件信息,所述租房信息数据为出租房屋
的房型、价格、地理位置以及所属标签,所述租房条件信息为供用户选择的房型、价格区间、地理位置区间以及所属标签。
[0014]第二方面,本专利技术提供了一种基于分类器与密度聚类算法的租房信息检索系统,包括:
[0015]数据采集模块,被配置为采集网络上的租房信息;
[0016]聚类分析模块,被配置为将租房信息按照特征的相似度进行聚类分析,在每一次的聚类过程中进行数据点之间的距离计算获得特征值,并且使用密度聚类的方式将设定相似度的租房信息归类为一个群组形成聚类区域;
[0017]训练模块,被配置为通过分类器建立租房信息的特征值与聚类区域之间的映射关系;
[0018]租房信息检索模块,被配置为获取目标用户的租房条件信息,获取租房条件信息的特征值并输入分类器,根据映射关系获取租房条件信息的特征值所对应的聚类区域,获取聚类区域内的租房信息。
[0019]第三方面,本专利技术提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成如第一方面所述的基于分类器与密度聚类算法的租房信息检索的方法。
[0020]第四方面,本专利技术提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成如第一方面所述的基于分类器与密度聚类算法的租房信息检索的方法。
[0021]与现有技术相比,本专利技术的有益效果为:
[0022]1、本专利技术将深度学习与数据挖掘相关的技术相整合,首先将租房信息按照各类特征相似度进行归类,其次使用分类器建立特征值与聚类区域之间的映射关系,以提高租房信息的检索效率与准确率。针对租房信息的聚类问题,本专利技术提出了基于多特征相似度的密度聚类方法(Density Clustering based on Multi

Feature Similarity,以下称MFS

DC)。MFS

DC对上述租房信息的各种特征进行分析,分别针对每一个特征设计相似度的度量函数,并且最终将各种特征的相似度相乘以得出最终的特征相似度。根据上述相似度度量函数,相似的租房信息被归为一类,以便于社区服务类应用的用户进行检索。
[0023]2、本专利技术使用Adaboost分类器建立租房信息特征值与聚类区域之间的映射关系,以缩短信息检索的长度,从而进一步地降低检索的时间复杂度,解决了租房信息检索过程中信息检索数据冗长,检索复杂,获取数据时间长,精度低的技术问题,提高租房信息的检索效率和精度。
[0024]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
[0025]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0026]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0027]图1为本专利技术的基于分类器与密度聚类算法的租房信息检索方法的示意图;
[0028]图2为本专利技术的分类器在租房信息特征值与聚类区域之间建立映射关系的结构示意图;
具体实施方式:
[0029]下面结合附图与实施例对本专利技术作进一步说明。
[0030]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0031]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0032]实施例一:
[0033]如图1所示,本实施例提供了基于分类器与密度聚类算法的租房信息检索方法,包括:
[0034]采集网络上的租房信息;
[0035]将租房信息按照特征的相似度进行聚类分析,在每一次的聚类过程中进行数据点之间的距离计算获得特征值,并且使用密度聚类的方式将设定相似度的租房信息归类为一个群组本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于分类器与密度聚类算法的租房信息检索方法,其特征在于,包括:采集网络上的租房信息;将租房信息按照特征的相似度进行聚类分析,在每一次的聚类过程中进行数据点之间的距离计算获得特征值,并且使用密度聚类的方式将设定相似度的租房信息归类为一个群组形成聚类区域;通过分类器建立租房信息的特征值与聚类区域之间的映射关系;获取目标用户的租房条件信息,获取租房条件信息的特征值并输入分类器,根据映射关系获取租房条件信息的特征值所对应的聚类区域,获取聚类区域内的租房信息。2.如权利要求1所述的基于分类器与密度聚类算法的租房信息检索方法,其特征在于,所述租房信息包括租房信息数据和租房条件信息。3.如权利要求2所述的基于分类器与密度聚类算法的租房信息检索方法,其特征在于,将租房信息按照特征的相似度进行聚类分析包括:将所述租房信息数据进行聚类分析,根据聚类分析结果设置若干个聚类标签,并获得设定聚类标签下的租房信息数据群组。4.如权利要求3所述的基于分类器与密度聚类算法的租房信息检索方法,其特征在于,通过分类器建立租房信息的特征值与聚类区域之间的映射关系步骤包括:将聚类标签、处于该聚类标签下的租房信息数据群组和租房条件信息输入分类器进行训练,获得训练好的分类器。5.如权利要求4所述的基于分类器与密度聚类算法的租房信息检索方法,其特征在于,所述获取聚类区域内的租房信息步骤包括:获取目标用户的租房条件信息,将目标用户的租房条件信息输入训练完成的分类器中获取满足目标用户租房条件的聚类标签和该聚类标签下的租房信息数据群组。6.如权利要求1所述的基于分类器与密度聚类算法的租房信息检索方法,其特征在于,将租房信息按照特征的相似度进行聚类分析包括:获取租房信...

【专利技术属性】
技术研发人员:管洪清徐亮王伟张元杰张大千尹广楹孙浩云
申请(专利权)人:青岛文达通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1