一种旅游景点的分类方法技术

技术编号:20655432 阅读:18 留言:0更新日期:2019-03-23 07:01
本发明专利技术提供了一种旅游景点的分类方法,与传统的旅游景点分类机制相比,该方法综合的考虑旅游景点的各个特征值,能准确客观的反映出旅游景点的实际档次,能够给游客的出行提供保障,作出合适的游览安排,能有效的降低人为因素带来的影响,客观的反映景区的实际环境,能为游客的决策提供一定的参考。不管对于旅游景区而言,还是游客,都有非常重要的意义,在预测分类的速度上,与传统的KNN算法相比,速度明显提升,由于充分的考虑旅游景点的各个特征,算法不会造成一定的特征损失,分类准确率高,然后对这些特征值进行标准化处理,改善了原有的K近邻算法的性能和效率。

【技术实现步骤摘要】
一种旅游景点的分类方法
本专利技术涉及旅游景点的分类与推荐领域,尤其涉及一种旅游景点的分类方法。
技术介绍
如何有效准确的对旅游资源进行分类,便于游客在有限的时间和经济成本下做出合适的游览安排,已经成为一个亟待解决的问题。目前,国内传统的分类方法主要基于游客评价信息的统计和专家系统的评分。这两种划分策略都存在缺点,即没有充分的考虑景点的各个特征,如旅游交通,旅游安全,游客满意度,卫生指数等特征,造成评价结果主观,片面,不能反映出景点实际状况。在数据分类领域中,K近邻算法由于其模型简单,不需要过多的调节参数,在低维特征数据集中预测速度快,准确性高,广泛的应用在图像,文本分类和数字识别系统中。传统的K近邻算法思想是首先给定一定数量已分类的低维特征样本集,样本集中每一项包含样本的特征和类别。其次将待分类的样本与已分类样本集进行距离度量,将求得的距离按照从小到大排序。最后取出前k个已分类样本所对应的类别,将出现次数最多的作为待分类样本的类别。但传统的K近邻算法存在缺点,传统的K近邻算法将待分类样本中的每维特征看成同一层次,并不区分每个特征在总特征中所占的比重,这会带来一定的特征损失。在计算距离时,需要将待分类的样本与已分类样本集中的每一项进行距离度量,当已分类样本集过于庞大时,时间复杂度明显增加。
技术实现思路
本专利技术的目的在于提供一种旅游景点的分类方法,以有效准确的对旅游资源进行分类。为了达到上述目的,本专利技术提供了一种旅游景点的分类方法,包括:提供待分类样本及若干已分类样本,所述已分类样本及所述待分类样本中均包括若干特征值;对所述待分类样本中的特征值进行数据标准化,使每个所述特征值均落入一特定区间内;以所述待分类样本为中心,建立高维超球面,在高维空间内不断扩大所述高维超球面的半径,直至若干所述已分类样本中有K个特征值落入所述高维超球面内;将所述K个特征值中出现次数最多的已分类样本的类别作为所述待分类样本的类别。可选的,采用如下公式对所述待分类样本中的特征值进行数据标准化:其中,vi、vmax、vmin、v′max及v′min分别为所述待分类样本中第i个特征值、第i个特征值的最大值、第i个特征值的最小值、所述特定区间的最大值及所述特定区间的最小值,v′i为特征值进行数据标准化后的特征值。可选的,所述特定区间为1-10。可选的,以所述待分类样本为中心,建立所述高维超球面的步骤包括:设所述待分类样本的特征向量为a=(a1,a2,a3,...an),其中a1,a2,a3,...an分别为所述待分类样本的第1维,第2维,.....第n维的特征值;根据公式(x-a1)2+(y-a2)2+(z-a3)2+....(w-an)2=r2得到所述高维超球面,其中,r为所述高维超球面的预定义半径,x,y,z,....w为所述高维超球面的n个维度。可选的,获取落入所述高维超球面内K个特征值的步骤包括:获取所有所述已分类样本中每个所述特征值与所述待分类样本的欧式距离;将所有所述特征值与所述待分类样本的欧式距离按照从小到大的顺序进行排序;选取最小的K个欧式距离对应的特征值为K个特征值。可选的,获取所述特征值与所述待分类样本的欧式距离的步骤包括:设所述已分类的样本点特征向量为b=(b1,b2,b3,...bn),其中,b1,b2,b3,...bn分别为所述已分类样本的第1维,第2维,.....第n维的特征值;所述特征值与所述待分类样本的欧式距离其中,j为所述特征值的维度。在本专利技术提供的旅游景点的分类方法中,与传统的旅游景点分类机制相比,该方法综合的考虑旅游景点的各个特征值,能准确客观的反映出旅游景点的实际档次,能够给游客的出行提供保障,作出合适的游览安排,能有效的降低人为因素带来的影响,客观的反映景区的实际环境,能为游客的决策提供一定的参考。不管对于旅游景区而言,还是游客,都有非常重要的意义,在预测分类的速度上,与传统的KNN算法相比,速度明显提升,由于充分的考虑旅游景点的各个特征,算法不会造成一定的特征损失,分类准确率高,然后对这些特征值进行标准化处理,改善了原有的K近邻算法的性能和效率。附图说明图1为本专利技术实施例提供的旅游景点的分类方法的流程图。具体实施方式下面将结合示意图对本专利技术的具体实施方式进行更详细的描述。根据下列描述和权利要求书,本专利技术的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本专利技术实施例的目的。如图1所示,本实施例提供了一种旅游景点的分类方法,包括:S1:提供待分类样本及若干已分类样本,所述已分类样本及所述待分类样本中均包括若干特征值;S2:对所述待分类样本中的特征值进行数据标准化,使每个所述特征值均落入一特定区间内;S3:以所述待分类样本为中心,建立高维超球面,在高维空间内不断扩大所述高维超球面的半径,直至若干所述已分类样本中有K个特征值落入所述高维超球面内;S4:将所述K个特征值中出现次数最多的已分类样本的类别作为所述待分类样本的类别。具体的,首先,采用国家旅游局官方网站发布的旅游景区评判指标,将指标依次分为旅游交通、游览、旅游安全、卫生指数、邮电服务、旅游购物、经营管理、资源和环境的保护、旅游资源影响力、市场吸引力及游客满意度等作为特征。选取一定数量的具有代表性的旅游景区作为样本,对于每一个样本,根据评分标准,分别对样本的每一个特征进行打分,根据旅游景区评判指标,构建一批具有代表性的旅游景区样本集,并分别将它们分为若干类(优,良及合格等),给每一个已分类样本中的每个特征值分配对应的标签。由于不同的特征值的值域不同,如旅游交通为130分,旅游安全为80分等,若不对上述特征值进行数据规范化,将带来一定的特征损失。选取一个待分类样本,读取该待分类样本的特征值,采用最小-最大值规范化来进行特征缩放,使其落入到一个较小的特定区间。可选的,采用如下公式对所述待分类样本中的特征值进行数据标准化:其中,vi、vmax、vmin、v′max及v′min分别为所述待分类样本中第i个特征值、第i个特征值的最大值、第i个特征值的最小值、所述特定区间的最大值及所述特定区间的最小值,v′i为特征值进行数据标准化后的特征值。可以理解的是,所述已分类样本中的每个特征值也进行了数据标准化处理,使得已分类样本中的每个特征值也处于特定区间内。本实施例中,所述特定区间为1-10。接着,以所述待分类样本为中心,建立一个高维超球面,设所述待分类样本的特征向量为a=(a1,a2,a3,...an),其中a1,a2,a3,...an分别为所述待分类样本的第1维,第2维,.....第n维的特征值;根据公式(x-a1)2+(y-a2)2+(z-a3)2+....(w-an)2=r2得到所述高维超球面,其中,r为所述高维超球面的预定义半径,x,y,z,....w为所述高维超球面的n个维度。根据用户预设置的K近邻算法的K值,在高维空间中不断扩大所述高维超球面的半径,直到有K个特征值落入所述高维超球面内,循环终止。为了获取最接近的K个特征值,需要计算所述特征值与所述待分类样本之间的距离,大多实验表明,采用欧式距离度量方法能有效的反映已测样本点和待测样本点之间的相似程度,所以本实施例中采用欧式距离计算。具体本文档来自技高网...

【技术保护点】
1.一种旅游景点的分类方法,其特征在于,包括:提供待分类样本及若干已分类样本,所述已分类样本及所述待分类样本中均包括若干特征值;对所述待分类样本中的特征值进行数据标准化,使每个所述特征值均落入一特定区间内;以所述待分类样本为中心,建立高维超球面,在高维空间内不断扩大所述高维超球面的半径,直至若干所述已分类样本中有K个特征值落入所述高维超球面内;将所述K个特征值中出现次数最多的已分类样本的类别作为所述待分类样本的类别。

【技术特征摘要】
1.一种旅游景点的分类方法,其特征在于,包括:提供待分类样本及若干已分类样本,所述已分类样本及所述待分类样本中均包括若干特征值;对所述待分类样本中的特征值进行数据标准化,使每个所述特征值均落入一特定区间内;以所述待分类样本为中心,建立高维超球面,在高维空间内不断扩大所述高维超球面的半径,直至若干所述已分类样本中有K个特征值落入所述高维超球面内;将所述K个特征值中出现次数最多的已分类样本的类别作为所述待分类样本的类别。2.如权利要求1所述的旅游景点的分类方法,其特征在于,采用如下公式对所述待分类样本中的特征值进行数据标准化:其中,vi、vmax、vmin、v′max及v′min分别为所述待分类样本中第i个特征值、第i个特征值的最大值、第i个特征值的最小值、所述特定区间的最大值及所述特定区间的最小值,v′i为特征值进行数据标准化后的特征值。3.如权利要求2所述的旅游景点的分类方法,其特征在于,所述特定区间为1-10。4.如权利要求2所述的旅游景点的分类方法,其特征在于,以所述待分类样本为中心,建立所述高维超球面的步骤包括:设所述待分类样本的特...

【专利技术属性】
技术研发人员:李凤英杨恩乙
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1