【技术实现步骤摘要】
基于景区评价的满意度提升系统和方法
[0001]本专利技术涉及旅游大数据
,具体涉及一种基于景区评价的满意度提升系统和方法。
技术介绍
[0002]对于景区满意度的调查最常见的方式就是问卷调查方法,而在线上旅游平台评价景区时,往往只有一个总体评分,很少会有对景区全方面、全维度的评价。
[0003]从景区管理者的角度来看,景区的总体评价比较轻易的获取,但无法明确了解游客实际的抱怨点,但该方法费时费力且准确度难以把握,无法精准定位问题所在,不利于总结经验,改善景区管理。
技术实现思路
[0004]针对现有技术的不足,本专利技术公开了一种基于景区评价的满意度提升系统和方法,用于解决动态监控景区满意度的变化趋势无法确定的问题,并基于改善因子帮助旅游管理部门、景区管理人员提升管理水平。
[0005]本专利技术通过以下技术方案予以实现:
[0006]第一方面,本专利技术提供了一种基于景区评价的满意度提升方法,包括以下步骤:
[0007]S1选择待评价景区,并通过爬虫获取游客在OTA网 ...
【技术保护点】
【技术特征摘要】
1.一种基于景区评价的满意度提升方法,其特征在于,所述方法包括以下步骤:S1选择待评价景区,并通过爬虫获取游客在OTA网站对该景区发布的评论数据信息;S2对获取的评论数据信息进行数据清洗,根据数据清洗规则筛除无效和冗余的数据;S3通过文本情感分析对评论数据信息中蕴含的情感总值进行量化,并通过句子求和计算景区该条评论的文本情感值;S4最终通过主题聚类分析正负向评论的主题,研究景区评价中对景区满意或者不满意的主要原因,并以此为改进提升满意度。2.根据权利要求1所述的基于景区评价的满意度提升方法,其特征在于,所述方法中,对数据清洗时规则包括:去除重复数据,去除缺失无效数据,短句删除,英文、数字、字符的删除,去除停用词及中文分词。3.根据权利要求2所述的基于景区评价的满意度提升方法,其特征在于,所述重复数据包括容重复数据和系统默认评论数据;所述无效数据包括内容缺失数据,数据集中多次出现空白评论,空值数据以及HTML超文本标签数据;所述短句删除是删除与评论内容较短的数据;所述中文分词是将数据切分处理转变成结构化数据。4.根据权利要求1所述的基于景区评价的满意度提升方法,其特征在于,所述方法中,通过文本情感分析进行情感值计算时,步骤如下:T1对评论数据信息进行句子切分得到子句;T2对切分后的子句进行分词处理和停用词处理;T3对情感词进行定位和赋值;T4对子句进行加权调整;T5对子句进行求和得到文本情感值。5.根据权利要求4所述的基于景区评价的满意度提升方法,其特征在于,所述步骤T2中,利用jieba分词对每个子句进行中文分词以及去除停用词,先对子句进行分词且分处理,然后进行停用词处理,将分词文本与本文构造的停用词词典进行匹配,删除匹配成功的停用词,未匹配成功的则保留。6.根据权利要求4所述的基于景区评价的满意度提升方法,其特征在于,所述步骤T5中,对子句进行求和时,假设一条景区在线评论文本被划分为n个子句,每个子句的情感值分别为senti1,senti2,....senti
n
,那么整条景区在线评论的情感倾向值为:7.根据权利要求1所述的基于景区评价的满意度提升方法...
【专利技术属性】
技术研发人员:付萍,陈海江,
申请(专利权)人:浙江力石科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。