一种能用于供应商评价的对话文本情感分析方法技术

技术编号:28037327 阅读:35 留言:0更新日期:2021-04-09 23:19
本发明专利技术公开了一种能用于供应商评价的对话文本情感分析方法,涉及电力运维领域。对话文本往往句法形式多样,口语化突出,语义情感丰富且存在情感转变,这给对话文本的情感分析带来了困难,从而影响了供应商评价的准确性。本发明专利技术在电力领域本体词典和通用词典基础上,识别与情感相关的关键词,分析情感评价基础单元和辅助单元的语义情感,不仅克服句法多样化困难,而且能识别对话文本语义情感转变。基于情感分析结果,根据建立的情感分析评价模型计算得到情感评价值。本技术方案能够解决对话文本句法形式多样、口语化突出、语义情感丰富且存在情感转变难以挖掘等问题,实现可靠的基于对话文本情感分析的供应商评价方法。

【技术实现步骤摘要】
一种能用于供应商评价的对话文本情感分析方法
本专利技术涉及电力运维领域,尤其涉及一种能用于供应商评价的对话文本情感分析方法。
技术介绍
我国电网企业在电力设备供应商评价过程中,通常以履约情况、售后服务和质量监督作为评价内容。今年,国网公司发布的2020年第一次供应商评价评分细则中新增了满意度评价,要求项目单位通过人工统计、直接计算的评分方式,根据供应商质量、服务、供货情况进行评分。然而,这种评分方式不仅效率较低,准确性受评分人员经验、评价材料范围等影响较大,还可能出现供应商仅重视评价内容的质量而轻视其他质量所造成的评价结果失真问题。随着腾讯通(RealTimeeXpert,RTX)、QQ等通讯软件的广泛应用,电网企业逐渐在各类业务平台建立起了工作群,管理人员和技术人员通过文字(语音可转文字)在工作群中进行技术交流时,会提及供应商更为细粒度的设备质量、服务等信息。这类信息来自一线人员,具有基础性、广泛性和高可信度等特点,可作为评价设备供应商的支撑数据之一。目前尚未对这些文本进行挖掘利用。主要的困难有:对话文本往往句法形式多样,口语化突出,语义情感本文档来自技高网...

【技术保护点】
1.一种能用于供应商评价的对话文本情感分析方法,其特征在于包括以下步骤:/n1)对话文本预处理;/n获取对话文本,并在电力领域本体词典和通用词典基础上进行对话文本预处理,包括分词、词性检索提取和标注;/n2)识别情感关键词并归类;/n找出句子中与情感相关的关键词,并对其进行归类,具体为:/n201)在电力领域本体词典的基础上,以分词和词性标注后的单句对话文本为分析对象,设置事件词Inc与情感词Sen为情感评价基础单元;设置连词Conj、程度副词Ad和否定词Neg为情感评价辅助单元,用于后续文本情感分析的修正;基础单元和辅助单元一起构成对话文本情感评价的主要单元;/n202)在单句对话文本中,基...

【技术特征摘要】
1.一种能用于供应商评价的对话文本情感分析方法,其特征在于包括以下步骤:
1)对话文本预处理;
获取对话文本,并在电力领域本体词典和通用词典基础上进行对话文本预处理,包括分词、词性检索提取和标注;
2)识别情感关键词并归类;
找出句子中与情感相关的关键词,并对其进行归类,具体为:
201)在电力领域本体词典的基础上,以分词和词性标注后的单句对话文本为分析对象,设置事件词Inc与情感词Sen为情感评价基础单元;设置连词Conj、程度副词Ad和否定词Neg为情感评价辅助单元,用于后续文本情感分析的修正;基础单元和辅助单元一起构成对话文本情感评价的主要单元;
202)在单句对话文本中,基础单元事件词Inc和情感词Sen中出现至少一个时,认为该句有情感倾向和评价意见,否则认为该句对设备供应商评价无价值;当句中仅出现Inc时,计入事件分;当句中仅有Sen时,计入情感分;当句中Inc和Sen并存时,考虑优先级的情况下同时计入情感分和事件分;当句中不存在Inc和Sen时,认为该句为中性,对情感评价无直接影响,作为冗余句子删除;
3)根据建立的对话情感分析规则,进行语义情感分析;
对话文本中情感评价的主要单元包括:事件词Inc、情感词Sen、连词Conj、程度副词Ad和否定词Neg;基于评价对象和主要单元的逻辑关系,得到情感关键词计分值:其中,对话情感分析规则为:
301)单句文本中存在事件词Inc;
事件词Inc作为专业性强且多为描述负面事件发生时的词汇,根据严重程度设定评分;Inci为第i个事件的情感评分,按一般、严重两种事件严重程度定值;
302)单句文本中存在情感词Sen;
情感词Sen参考Bosonnlp开源计算机语义分析处理库根据情感正向和负向设定评分,Senj为第j个情感词的情感评分;
303)单句文本中存在程度副词Ad;根据程度副词的极性强度设定极性系数,Adk为第k个程度副词的情感极性系数;若无程度副词,则用Ad0表示;
304)单句文本中存在否定词Neg;根据是否存在否定词确定否定系数值,其中Negl为第l个否定词的否定系数;若无否定词,则用Neg0表示;
305)当句中存在多个事件词Inc或情感词Sen,需要对句子情感语义和转变进行判断;当存在连词Conj时,根据连词和基础单元的位置关系及连词转折关系判断情感语义评价优先级,确定连词关系语义评价优先系数ηC;其中,以连词为界限,连词前的基础单元优先系数为ηCb,连词后的基础单元优先系数为ηCa;
306)当句中同时存在事件词Inc和情感词Sen时,事件词作为客观陈述事实类词语,其评价信服力高于主观情感词,事件词Inc和情感词Sen基础单元的关系评价优先系数ηY分别为ηYI和ηYS;
307)对于句中每个基础单元,综合前述方法305)和方法306),其评价优先系数η为:η=ηC×ηY;其中,ηC为连词关系语义评价优先系数,ηY为基础单元关系评价优先系数;根据基础单元类型,用ηI表示事件词的优先系数;用ηS表示情感词的优先系数;
308)基础单元事件词Inc和情感词Sen与程度副词Ad和否定词Neg的依附关系,如有连词Conj则以连词为划分界限,如无连词以每个基础单元为划分界限;
4)根据建立的情感分析评价模型计算得到情感评价值;
针对同主题对话集合,情感分析评价结合情感评价基础单元和辅助单元的关系特征来给出;每个基础单元受该单元优先系数、程度副词和否定词系数直接影响,通过系数串联乘积对基础单元评分直接修正;基础单元之间互相独立,通过并联加法联系;对于同主题下同评价对象供应商,计算其以句为单位的情感评分值,该值的正负直观反映对话者的正向或负向评价,该值的大小则反映了情感的强度;由此,得到单句的情感分析评价模型:



其中,SMANu为第u个单句供应商评分情感评价值;I表示句中事件词的数量;ηIi表示第i个事件词的优先系数,由步骤3中的307)计算得到;K表示每个事件词附属程度副词的数量;L表示每个事件词附属否定词的数量;J表示句中情感词的数量;ηSj表示第j个情感词的优先系数,也由步骤3中的307)计算得到;P表示每个情感词附属程度副词的数量;Q表示每个情感词附属否定词的数量;其中k、l、p、q取值从0开始,表示不存在对应辅助单元时该系数取其初始值1;
供应商的总情感评价值评价分为所有单句评分之和:即总情感分析评价模型;
其中,SMAN为总供应商的情感评价值;U为评价句的数量;
5)根据未来语言发展,遵循自然规律,定期对词典进行扩充,并对...

【专利技术属性】
技术研发人员:张凤翱董寒宇王慧芳金丽娟沈煜宾李越玮卢洪涛严娴峥
申请(专利权)人:国网浙江省电力有限公司湖州供电公司浙江大学浙江华云信息科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1