【技术实现步骤摘要】
基于舆情知识图谱的公共交通乘客满意度评价方法及系统
本专利技术涉及交通运输工程领域、计算机领域。
技术介绍
公共交通乘客满意度指对公共交通服务的可得性、安全可靠性及便捷舒适度等方面体验的满意程度,其是了解乘客细致化交通需求的重要依据,提高城市公共交通精细化服务水平的重要途径。基于乘客视角开展主观服务质量评价,挖掘服务质量与服务感知差距,通过满意度评价结果定位需改进的服务模块与服务环节。传统满意度评价数据来源于调查问卷,存在诸多缺陷。如样本量受限,覆盖度低、调查时间离散。受制于调查成本,满意度评价的质量提升空间不大,更无法满足长效监控、精细化服务改进需求;调查结果通常仅反映宏观服务水平,无法定位具体问题及其对应改进措施。公共交通舆情是乘客对日常服务感知的即时反映,具有动态性、及时性。公共交通客流规模巨大,乘客越来越关注出行服务过程,且随着互联网+公交技术的广泛应用,网络信息反馈平台多样,每日产生交通舆情数据巨大。因此,通过互联网获取公共交通舆情信息,通过知识图谱等人工智能技术映射服务模块,能够较高频率、更大范围地反映乘客对服务质量的评价,该方法具有覆盖的公共交通方式多(公交、地铁、定制公交等),覆盖服务环节完整,覆盖服务时段广泛,便于实时动态监督等优点。为改进基于问卷调查的传统乘客满意度分析方法,拟采用基于网络舆情分析的乘客满意度分析模型,并结合知识图谱技术实现关联关系的分析与确认。通过舆情分析方法获取乘客的评论数据、用户画像,分析经典满意度评价模型,确定适于舆情文本信息的满意度评价指标,构建公 ...
【技术保护点】
1.一种基于舆情知识图谱的公共交通乘客满意度评价方法。其特征在于,包括如下步骤:/nS1:实施文本获取与处理分析;/nS2:完成公共交通知识图谱的建模与存储;/nS3:“潜水”乘客满意度信息获取与分析;/nS4:实现舆情指标映射,服务分值研判和历史事件方法库的构建。/n
【技术特征摘要】
1.一种基于舆情知识图谱的公共交通乘客满意度评价方法。其特征在于,包括如下步骤:
S1:实施文本获取与处理分析;
S2:完成公共交通知识图谱的建模与存储;
S3:“潜水”乘客满意度信息获取与分析;
S4:实现舆情指标映射,服务分值研判和历史事件方法库的构建。
2.根据权利要求1所述的一种基于舆情知识图谱的公共交通乘客满意度评价方法,其特征是,在步骤S1中,实施文本获取与处理分析的具体步骤为:获取公共交通网络舆情数据,进行文本预处理,构建交通舆情主题分类模型,分析舆情情感与演变特征。
3.根据权利要求1所述的一种基于舆情知识图谱的公共交通乘客满意度评价方法,其特征是,在步骤S3中,“潜水”乘客满意度信息获取与分析的具体步骤为:爬取舆情文本相关附属信息,爬取用户日常文本信息,挖掘用户互动信息,获取初始情感判别结果,情感分析结果检验,重复实验结果校验。
4.根据权利要求1所述的一种基于舆情知识图谱的公共交通乘客满意度评价方法,其特征是,在步骤S4中,实现舆情指标映射,服务分值研判和历史事件方法库的构建的具体步骤为:明确部省市三级部门职责与舆情文本和国标指标对应关系,完成舆情文本与评价指标初步映射,将公共交通舆情文本按分类后数据分别输入图谱;构建公共交通情感词典,进行文本情感分析,完成文本情感分值研判;构建历史事件方法库,辅助短板部门决策。
5.根据权利要求2所述的方法中,其特征在于,
所述构建交通舆情主题分类模型,包括:采用向量空间模型将文本转化为向量,每一个文本表示为n维向量空间的一个向量v,向量中每一维对应一个特征项。选取词作为文本特征项,TF-IDF值作为每一个词的权值,通常每个文本需要对TF-IDF做归一化处理;基于此,将文本分类问题转化为求待分类向量与已知主题向量的相似度问题;
所述舆情情感与演化特征分析,包括:关注度重点考虑点赞数、评论量、转发数,并依据花费时间长短对参数赋权,关注度增量按照相邻时间段关注度差值比计算,并通过置换训练文本,完成交通情感分析模块初步构建;
基于此,完成各时间段情感极性分布研究,制作交通舆情热词词云,结合关键词频数折线图等方式进行可视化研究。
6.根据权利要求3所述的方法中,其特征在于,
所述爬取舆情文本相关附属信息,包括:爬取相应舆情文本点赞人员列表、评论人员列表,筛选出点赞且并未发表评论的用户,获取该用户主页文本信息,如性别、昵称、所在地、简介等;
所述爬取用户日常文本信息,包括:爬取该类用户较近时期发表的日常微博内容;
所述挖掘用户互动信息,包括:挖掘该类用户“他的关注”对象以及频繁互动对象基本信息,尤其与目标文本有关联的“他的关注”对象信息;
所述获取初始情感判别结果,包括:将“温数据画像”和“热数据画像”的情感倾向分别赋予初始权重,计算求得一定概率下初始情感倾向判别结果;
所述情感分析结果检验,包括:向用户推送同类情感性质的公共交通微博文本;以一定时间段内公共交通乘客满意度事件为题目核心,对该类用户发放专用调查问卷。
7.根据权利要求4所述的方法中,其特征在于,所述实现舆情指标映射,包括:
主题分类模型,将舆情文本数据表示为向量形式,并将乘客满意度国标一级指标作为分类核心,通过相似度计算实现舆情文本分类,初步实现舆情文本与评价指标的映射;
将公共交通舆情文本按分类后数据分别输入知识图谱,采用基于规则学习的推理AMIE算法,通过SPARQL在知识图谱上的查询对规则的质量进行评价,实现知识图谱推理,二者结合完成舆情文本与指标的映射;
所述服务分值研判,包括:以公开的中文情感极性词典为基础,辅助补充公共交通行业情感元素,构建公共交通情感词典;进行文本情感分析时,将长句分割成短句进行剖析,之后再拼凑实现整句情感判断;基于情感极性和情感程度判断进行情感评分;
所述构建历史事件方法库,辅助短板部门决策时,决策打分为措施改进前后相邻两次满意度相应指标评分差值,以及差值与改进前指标数值的比值,按照决策分值,选取排名前五的措施为短板部门提供辅助决策;首先,比较绝对评分差值,当评分差值大于规定阈值Ω时,直接选取绝对评分高的一方为优先选择项;其次,当评分差值小于规定阈值Ω时,比较差值与改进前指标数值的比值,选取比值较小者为优先选择项。
8.一种基于舆情知识图谱的公共交通乘客满意度评价系统,其特征在于,包括:
数据模块,实施文本获取与处理分析;
图谱模块,完成公共交通知识图谱的建模与存储;
应用模块,实现“潜水”乘客满意度信息分析,舆情指标映射,服务分值研判和历史事件方法库的构建。
9.如权利要求8所述的基于舆情知识图谱的公共交通乘客满意度评价系统,其特征在于,其中:
所述数据模块包括实时模块、处理模块、分析模块;
实时模块:通过网络爬虫工具,实时获取微博、微信、新闻客户端等舆情产生地的交通舆情文本数据,包括用户名、用户ID、文本正文、发表时间、点赞数、转发数、评论信息、定位地点等非结构化文本数据;
处理模块:对实时模块所获取的数据进行文本处理,采用Python的正则表达式、BeautifulSoup模块去除文本的非中文数据,删除对文本无影响内容,如“网页链接”等标签,@后紧邻文字等;去除所有标点符号,感叹号“!”除外;使用utf-8编码存储、读取后处理采用GBK编码格式;导入构建的公共交通事件名词库,结合HanLP、结巴分词工具实现文本分词与词性标注;使用基于字典的方法,剔除停用词;
数据模块中的分析模块,其包括交通舆情主题分类模块、舆情情感演化特征分析模块;其中,交通舆情主题分类模块:采用向量空间模型将文本转化成向量,每一个文本表示为n维向量空间的一个向量v,向量中每一维对应一个特征项,选取词作为文本特征项,使用文本向量化,通过求待分类向量与已知主题向量的相似度,得到主题分类结果;基于此模块,完成部门—职责、职责—指标以及文本—指标的文本主题预分类;舆情情感演化特征分析模块,第一,演化特征分析主要依据关注度和关注度增量两项指标,其中关注度重点考虑点赞数、评论量、转发数,并依据花费时间长短对参数赋...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。