当前位置: 首页 > 专利查询>同济大学专利>正文

基于舆情知识图谱的公共交通乘客满意度评价方法及系统技术方案

技术编号:26304138 阅读:59 留言:0更新日期:2020-11-10 19:59
一种基于舆情知识图谱的公共交通乘客满意度评价方法及系统,综合考虑了基于问卷调查和基于公共交通网络舆情的乘客满意度分析方法,应用网络舆情分析技术、自然语言分析方法、公共交通知识图谱、机器学习等方法对传统公共交通乘客满意度分析作出了有力补充。该发明专利技术主要包括:实施文本获取与处理分析;完成公共交通舆情知识图谱的建模与存储;“潜水”乘客满意度信息获取与分析;实现舆情指标映射、服务分值研判和历史事件方法库的构建。实现文本主题分类、满意度指标定位,明确满意度与部门及其职责对应关系,以便能够为传统公共交通乘客满意度分析提供有力补充,也能够为了解公共交通乘客需求、相关部门服务短板提供更科学的参考意见的效果。

【技术实现步骤摘要】
基于舆情知识图谱的公共交通乘客满意度评价方法及系统
本专利技术涉及交通运输工程领域、计算机领域。
技术介绍
公共交通乘客满意度指对公共交通服务的可得性、安全可靠性及便捷舒适度等方面体验的满意程度,其是了解乘客细致化交通需求的重要依据,提高城市公共交通精细化服务水平的重要途径。基于乘客视角开展主观服务质量评价,挖掘服务质量与服务感知差距,通过满意度评价结果定位需改进的服务模块与服务环节。传统满意度评价数据来源于调查问卷,存在诸多缺陷。如样本量受限,覆盖度低、调查时间离散。受制于调查成本,满意度评价的质量提升空间不大,更无法满足长效监控、精细化服务改进需求;调查结果通常仅反映宏观服务水平,无法定位具体问题及其对应改进措施。公共交通舆情是乘客对日常服务感知的即时反映,具有动态性、及时性。公共交通客流规模巨大,乘客越来越关注出行服务过程,且随着互联网+公交技术的广泛应用,网络信息反馈平台多样,每日产生交通舆情数据巨大。因此,通过互联网获取公共交通舆情信息,通过知识图谱等人工智能技术映射服务模块,能够较高频率、更大范围地反映乘客对服务质量的评价,该方法具有覆盖的公共交通方式多(公交、地铁、定制公交等),覆盖服务环节完整,覆盖服务时段广泛,便于实时动态监督等优点。为改进基于问卷调查的传统乘客满意度分析方法,拟采用基于网络舆情分析的乘客满意度分析模型,并结合知识图谱技术实现关联关系的分析与确认。通过舆情分析方法获取乘客的评论数据、用户画像,分析经典满意度评价模型,确定适于舆情文本信息的满意度评价指标,构建公共交通乘客满意度知识图谱,完成“事件—指标—职责—部门”的对应关系分析。下文分别简述三部分的技术现状。1)满意度评价理论满意度评价指标体系一般不超过三级,满意度问题设置一般不超过40个。评价模型主要分为三类,服务质量评价模型(SERVQUAL),服务绩效模型(SERVPERF)和结构化方程模型SEM(StructuralEquationModeling)。2018年国家城市客运标准委员会组织完成了《城市公共交通乘客满意度评价方法》,其设置了公共汽电车交通和城市轨道交通的准则层指标和相应一级指标,建议基于调查问卷采用服务绩效模型或结构方程模型进行满意度分析,并给出对应模型参数估计方法、指标权重确定方法等。2)知识图谱技术知识图谱是一种使用图模型描述知识和建模事物关联关系的技术方法,其作为一种知识表示形式,已在语义搜索、辅助问答、关系研判、自然语言理解等诸多人工智能手段中发挥巨大作用。互联网大数据的迅猛集聚、人工智能算法的快速发展,为知识图谱提供前沿科技和发展条件。至此,知识图谱已完全具备识别舆情与服务要素的关联关系能力,为完善乘客满意度分析手段提供思路。3)舆情分析技术舆情是作为主体的民众对作为客体的社会事件等发表的观点及所持有的态度,舆情整体模块分析方法已较为成熟,主要包括:网络舆情数据的获取,舆情事件主题建模,舆情生命周期演化分析,热词定位以及可视化研究等。基于舆情分析基本技术,结合交通事件舆情特征、交通事件主题分类、交通事件情感库等可以实现交通事件网络舆情系统分析。随着自然语言分析技术、机器学习方法等的不断发展与完善,舆情分析的准确率、分析效率也在逐步地提升。
技术实现思路
本专利技术的目的是提供一种基于知识图谱的公共交通乘客满意度分析方法及系统。具有自动获取文本数据并进行自然语言分析,实现文本主题分类、满意度指标定位,明确满意度与部门及其职责对应关系,以便能够为传统公共交通乘客满意度分析提供有力补充,也能够为了解公共交通乘客需求、相关部门服务短板提供更科学的参考意见的效果。本专利技术的上述技术目的是通过以下技术方案得以实现的:技术方案一一种基于舆情知识图谱的公共交通乘客满意度分析方法,包括以下步骤:S1:实施文本获取与处理分析;S2:完成公共交通知识图谱的建模与存储;S3:“潜水”乘客满意度信息获取与分析;S4:实现舆情指标映射,服务分值研判和历史事件方法库的构建。技术方案二一种基于知识图谱的公共交通乘客满意度分析系统,包括:数据模块,实施文本获取与处理分析;图谱模块,完成公共交通知识图谱的建模与存储;应用模块,实现“潜水”乘客满意度信息分析,舆情指标映射,服务分值研判和历史事件方法库的构建。本专利技术创新点:1)基于乘客满意度评价的系统性技术路线提出一套基于舆情的乘客满意度评价系统性技术路线——“舆情数据获取,舆情主题建模,舆情情感分析,服务指标映射,服务分数研判,满意度计算模型,结果可视化分析”。相比传统的问卷调查方式调查乘客满意度,大大增加了乘客满意度的调查样本量的同时,减少了调查人力成本,增加调查的实效性,进而实现秒级实时乘客满意度趋势跟踪。2)基于知识图谱的舆情与满意度服务指标映射提出一种通过知识图谱实现舆情事件与满意度评价指标映射的方法,填补了公共交通舆情文本与乘客满意度服务指标转换方法的空缺。3)基于情感分析的满意度指标评分提出一种基于交通舆情数据,使用自然语言分析、文本情感分析等技术完成舆情文本与服务指标评分的映射方法,完善了公共交通舆情文本与满意度分值数字语言的转化方法。4)“潜水”乘客满意度分析方法提出一种基于知识图谱的“潜水”乘客满意度分析方法。“潜水”乘客即本身关注事件的发展,但懒于作出明显的表态,即未发表评论,但他们通过点赞等方式间接表达观点,且此类乘客数量占据总乘客数的比例较大,对其进行研究具有重要意义。通过实现描摹用户画像,剖析用户关系网络等,解决了互联网未发表意见的“潜水”乘客的发现以及情感倾向的判别问题,并通过补充调查问卷的形式对“潜水”乘客进行调研,弥补了互联网舆情判别偏差的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。下面描述中的附图是本专利技术的一些实施例,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献修改,但只要在本专利技术的权利要求范围内都受到专利法的保护。图1为专利技术方法流程示意图;图2为本专利技术基于乘客满意度评价的流程;图3为本专利技术基于情感分析的满意度指标评分流程;图4为本专利技术“潜水”乘客满意度分析方法流程图;图5为本专利技术系统的结构示意图;图6为本专利技术基于乘客满意度评价系统的结构示意图;图7为本专利技术基于情感分析的满意度指标评分系统结构示意图;图8为本专利技术“潜水”乘客满意度分析系统结构示意图;图9为本专利技术数据模块中的分析模块结构示意图;具体实施方式为了使本专利技术所要解决的技术问题、技术方案以及有益效果更加清楚明白,以下结合附图以及部分举例,对本专利技术进行进一步详细说明。本专利技术的第一个方面是提供一种基于知识图谱的公共交通乘客满意度分析方法:S1:实施本文档来自技高网
...

【技术保护点】
1.一种基于舆情知识图谱的公共交通乘客满意度评价方法。其特征在于,包括如下步骤:/nS1:实施文本获取与处理分析;/nS2:完成公共交通知识图谱的建模与存储;/nS3:“潜水”乘客满意度信息获取与分析;/nS4:实现舆情指标映射,服务分值研判和历史事件方法库的构建。/n

【技术特征摘要】
1.一种基于舆情知识图谱的公共交通乘客满意度评价方法。其特征在于,包括如下步骤:
S1:实施文本获取与处理分析;
S2:完成公共交通知识图谱的建模与存储;
S3:“潜水”乘客满意度信息获取与分析;
S4:实现舆情指标映射,服务分值研判和历史事件方法库的构建。


2.根据权利要求1所述的一种基于舆情知识图谱的公共交通乘客满意度评价方法,其特征是,在步骤S1中,实施文本获取与处理分析的具体步骤为:获取公共交通网络舆情数据,进行文本预处理,构建交通舆情主题分类模型,分析舆情情感与演变特征。


3.根据权利要求1所述的一种基于舆情知识图谱的公共交通乘客满意度评价方法,其特征是,在步骤S3中,“潜水”乘客满意度信息获取与分析的具体步骤为:爬取舆情文本相关附属信息,爬取用户日常文本信息,挖掘用户互动信息,获取初始情感判别结果,情感分析结果检验,重复实验结果校验。


4.根据权利要求1所述的一种基于舆情知识图谱的公共交通乘客满意度评价方法,其特征是,在步骤S4中,实现舆情指标映射,服务分值研判和历史事件方法库的构建的具体步骤为:明确部省市三级部门职责与舆情文本和国标指标对应关系,完成舆情文本与评价指标初步映射,将公共交通舆情文本按分类后数据分别输入图谱;构建公共交通情感词典,进行文本情感分析,完成文本情感分值研判;构建历史事件方法库,辅助短板部门决策。


5.根据权利要求2所述的方法中,其特征在于,
所述构建交通舆情主题分类模型,包括:采用向量空间模型将文本转化为向量,每一个文本表示为n维向量空间的一个向量v,向量中每一维对应一个特征项。选取词作为文本特征项,TF-IDF值作为每一个词的权值,通常每个文本需要对TF-IDF做归一化处理;基于此,将文本分类问题转化为求待分类向量与已知主题向量的相似度问题;
所述舆情情感与演化特征分析,包括:关注度重点考虑点赞数、评论量、转发数,并依据花费时间长短对参数赋权,关注度增量按照相邻时间段关注度差值比计算,并通过置换训练文本,完成交通情感分析模块初步构建;
基于此,完成各时间段情感极性分布研究,制作交通舆情热词词云,结合关键词频数折线图等方式进行可视化研究。


6.根据权利要求3所述的方法中,其特征在于,
所述爬取舆情文本相关附属信息,包括:爬取相应舆情文本点赞人员列表、评论人员列表,筛选出点赞且并未发表评论的用户,获取该用户主页文本信息,如性别、昵称、所在地、简介等;
所述爬取用户日常文本信息,包括:爬取该类用户较近时期发表的日常微博内容;
所述挖掘用户互动信息,包括:挖掘该类用户“他的关注”对象以及频繁互动对象基本信息,尤其与目标文本有关联的“他的关注”对象信息;
所述获取初始情感判别结果,包括:将“温数据画像”和“热数据画像”的情感倾向分别赋予初始权重,计算求得一定概率下初始情感倾向判别结果;
所述情感分析结果检验,包括:向用户推送同类情感性质的公共交通微博文本;以一定时间段内公共交通乘客满意度事件为题目核心,对该类用户发放专用调查问卷。


7.根据权利要求4所述的方法中,其特征在于,所述实现舆情指标映射,包括:
主题分类模型,将舆情文本数据表示为向量形式,并将乘客满意度国标一级指标作为分类核心,通过相似度计算实现舆情文本分类,初步实现舆情文本与评价指标的映射;
将公共交通舆情文本按分类后数据分别输入知识图谱,采用基于规则学习的推理AMIE算法,通过SPARQL在知识图谱上的查询对规则的质量进行评价,实现知识图谱推理,二者结合完成舆情文本与指标的映射;
所述服务分值研判,包括:以公开的中文情感极性词典为基础,辅助补充公共交通行业情感元素,构建公共交通情感词典;进行文本情感分析时,将长句分割成短句进行剖析,之后再拼凑实现整句情感判断;基于情感极性和情感程度判断进行情感评分;
所述构建历史事件方法库,辅助短板部门决策时,决策打分为措施改进前后相邻两次满意度相应指标评分差值,以及差值与改进前指标数值的比值,按照决策分值,选取排名前五的措施为短板部门提供辅助决策;首先,比较绝对评分差值,当评分差值大于规定阈值Ω时,直接选取绝对评分高的一方为优先选择项;其次,当评分差值小于规定阈值Ω时,比较差值与改进前指标数值的比值,选取比值较小者为优先选择项。


8.一种基于舆情知识图谱的公共交通乘客满意度评价系统,其特征在于,包括:
数据模块,实施文本获取与处理分析;
图谱模块,完成公共交通知识图谱的建模与存储;
应用模块,实现“潜水”乘客满意度信息分析,舆情指标映射,服务分值研判和历史事件方法库的构建。


9.如权利要求8所述的基于舆情知识图谱的公共交通乘客满意度评价系统,其特征在于,其中:
所述数据模块包括实时模块、处理模块、分析模块;
实时模块:通过网络爬虫工具,实时获取微博、微信、新闻客户端等舆情产生地的交通舆情文本数据,包括用户名、用户ID、文本正文、发表时间、点赞数、转发数、评论信息、定位地点等非结构化文本数据;
处理模块:对实时模块所获取的数据进行文本处理,采用Python的正则表达式、BeautifulSoup模块去除文本的非中文数据,删除对文本无影响内容,如“网页链接”等标签,@后紧邻文字等;去除所有标点符号,感叹号“!”除外;使用utf-8编码存储、读取后处理采用GBK编码格式;导入构建的公共交通事件名词库,结合HanLP、结巴分词工具实现文本分词与词性标注;使用基于字典的方法,剔除停用词;
数据模块中的分析模块,其包括交通舆情主题分类模块、舆情情感演化特征分析模块;其中,交通舆情主题分类模块:采用向量空间模型将文本转化成向量,每一个文本表示为n维向量空间的一个向量v,向量中每一维对应一个特征项,选取词作为文本特征项,使用文本向量化,通过求待分类向量与已知主题向量的相似度,得到主题分类结果;基于此模块,完成部门—职责、职责—指标以及文本—指标的文本主题预分类;舆情情感演化特征分析模块,第一,演化特征分析主要依据关注度和关注度增量两项指标,其中关注度重点考虑点赞数、评论量、转发数,并依据花费时间长短对参数赋...

【专利技术属性】
技术研发人员:滕靖刘韶杰
申请(专利权)人:同济大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1