文本情感分析系统及方法、存储介质技术方案

技术编号:18525871 阅读:28 留言:0更新日期:2018-07-25 12:44
本发明专利技术实施例提供了一种文本情感分析系统及方法、存储介质,所述方法包括:获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联的语义关联文本,以及语义关联文本时刻;基于所述待分析文本时刻和所述语义关联文本时刻,对所述待分析文本和所述语义关联文本按照时间顺序进行排序,得到排序文本;对所述排序文本进行分词处理,获得排序文本分词;对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。采用所述系统及方法、存储介质,可以提高文本情感分析的准确性。

【技术实现步骤摘要】
文本情感分析系统及方法、存储介质
本专利技术实施例涉及在线教育领域,尤其涉及一种文本情感分析系统及方法、存储介质。
技术介绍
文本情感分析,也就是分析文本所携带的主观性意见,通过对文本的情感分析,可以帮助人们快速了解文本的主观意见,以便进行统计或及时反馈。例如:在教育领域的直播课堂(利用直播平台进行教育的一种在线教育方式)上,在教学过程中,教师通过人为观看弹幕文本的方式获取学生的实时反馈,进行师生之间的互动,这种方式很简单,但容易分散老师教学的注意力,影响教学质量,且如果弹幕文本很多,老师也没有精力同时去处理多条弹幕文本,没法把关注点分散到每一个学生身上。同时,为提高教学质量,还需了解学生对于直播课堂的反馈,目前采用的是根据学生的课后评价和反馈的方式,这种方式的信息获得需要在课后一段时间才能完成,是滞后的,不利于及时了解情况并进行相应的调整。现有技术中,为了辅助教师把握上述情况,就需要对文本进行情感分析,然后通过筛选或统计的方式输出给教师,然而,由于直播课堂的特殊性,学生所发出的弹幕文本大都为短文本,这就直接影响了分析结果的准确性。因此,如何提高文本情感分析的准确性,成为亟需解决的技术问题。
技术实现思路
本专利技术实施例解决的技术问题是提供一种文本情感分析系统和方法,以提高文本情感分析的准确性。为解决上述问题,本专利技术实施例提供一种文本情感分析系统,包括:获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联的语义关联文本,以及语义关联文本时刻;基于所述待分析文本时刻和所述语义关联文本时刻,对所述待分析文本和所述语义关联文本按照时间顺序进行排序,得到排序文本;对所述排序文本进行分词处理,获得排序文本分词;对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。可选地,还包括:对所述排序文本分词进行场景关联筛选,得到场景关联文本分词;所述对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数,包括:对所述场景关联文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。可选地,所述对所述排序文本分词进行场景关联筛选,得到场景关联文本分词,包括:计算所述排序文本分词与场景文本库中的场景文本的相似度;筛选出所述相似度大于相似度阈值的所述排序文本分词,得到所述场景关联文本分词。可选地,对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数,包括:在情感分词词典中的查找所述排序文本分词的情感极性分数,所述情感分词词典中包括情感词和修饰所述情感词的修饰词;计算所述情感词和所述修饰词的加权情感分数,获得所述待分析文本的情感极性分数。可选地,所述获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联的语义关联文本,以及语义关联文本时刻,包括:获取所述待分析文本和所述待分析文本时刻;根据所述待分析文本和所述待分析文本时刻,从动态文本库中筛选获得所述语义关联文本及所述语义关联文本时刻,所述动态文本库的文本时刻位于所述待文本时刻前的时间阈值内。可选地,所述根据所述待分析文本和所述待分析文本时刻,从动态文本库中筛选获得所述语义关联文本及所述语义关联文本时刻,包括:将所述待分析文本转化为待分析文本特征向量,将所述动态文本库中的文本1转化为文本特征向量1,……,文本n转化为文本特征向量n,n≥1,n为整数;设定存储关联向量的关联向量库,所述关联向量包括所述待分析文本特征向量和已获得的语义关联文本特征向量,所述关联向量库包括关联向量库1、关联向量库2、……、关联向量库n,n≥1,n为整数;计算所述文本特征向量1和所述关联向量库1中的各所述关联向量的关联度,比较各所述关联度得到最大关联度,所述最大关联度与关联度阈值比较,得到所述最大关联度大于所述关联度阈值的语义关联文本特征向量1,将所述语义关联文本特征向量1存储至所述关联向量库1,得到关联向量库2;以此类推,计算所述文本特征向量n和所述关联向量库n中的各所述关联向量的关联度,比较各所述关联度得到最大关联度,所述最大关联度与关联度阈值比较,得到所述最大关联度大于所述关联度阈值的语义关联文本特征向量n,将所述语义关联文本特征向量n存储至所述关联向量库n-1,得到关联向量库n;从所述关联向量库n中获取所有语义关联文本特征向量、所述语义关联文本和所述语义关联文本时刻。可选地,所述动态文本库中的所述文本包括字符文本和语音文本。可选地,所述语音文本通过语音识别算法识别为字符文本。可选地,所述关联度为余弦距离的倒数。为解决所述问题,本专利技术实施例还提供一种文本情感分析系统,包括:文本及文本时刻获取装置,适于获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联的语义关联文本,以及语义关联文本时刻;文本排序装置,适于基于所述待分析文本时刻和所述语义关联文本时刻,对所述待分析文本和所述语义关联文本按照时间顺序进行排序,得到排序文本;分词装置,适于对所述排序文本进行分词处理,获得排序文本分词;情感极性分数计算装置,适于对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。可选地,还包括:场景文本确定装置,适于对所述排序文本分词进行场景关联筛选,得到场景关联文本分词;所述情感极性分数计算装置对所述场景关联文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。可选地,所述文本确定装置,包括:相似度计算装置,适于计算所述排序文本分词与场景文本库中的场景文本的相似度;文本筛选装置,适于筛选出所述相似度大于相似度阈值的所述排序文本分词,得到所述场景关联文本分词。可选地,所述情感极性分数计算装置包括:分词情感极性分数查找装置,适于在情感分词词典中的查找所述排序文本分词的情感极性分数,所述情感分词词典中包括情感词和修饰所述情感词的修饰词;情感极性分数加权计算装置,适于计算所述情感词和所述修饰词的加权情感分数,获得所述待分析文本的情感极性分数。可选地,文本及文本时刻获取装置包括:待分析文本及待分析文本时刻获取装置,适于获取所述待分析文本和所述待分析文本时刻;语义关联文本及语义关联文本时刻获取装置,适于根据所述待分析文本和所述待分析文本时刻从动态文本库中筛选获得所述语义关联文本及所述语义关联文本时刻,所述动态文本库中的文本时刻位于所述待文本时刻前的时间阈值内。可选地,语义关联文本及语义关联文本时刻获取装置,包括:特征向量转化装置,适于将所述待分析文本转化为待分析文本特征向量,将所述动态文本库中的文本1转化为文本特征向量1,……,文本n转化为文本特征向量n,n≥1,n为整数;关联向量库设定装置,适于设定存储关联向量的关联向量库,所述关联向量包括所述待分析文本特征向量和已获得的语义关联文本特征向量,所述关联向量库包括关联向量库1、关联向量库2、……、关联向量库n,n≥1,n为整数;语义关联文本筛选装置,适于计算所述文本特征向量1和所述关联向量库1中的各所述关联向量的关联度,比较各所述关联度得到最大关联度,所述最大关联度与关联度阈值比较,得到所述最大关联度大于所述关联度阈值的语义关联文本特征向量1,将所述语义关联文本特征向量1存储至所述关联向量库1,得到关联向量库2;以此类推,计算所述文本特征向量n和所述关联向量库n中的各所本文档来自技高网...

【技术保护点】
1.一种文本情感分析方法,其特征在于,包括:获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联的语义关联文本,以及语义关联文本时刻;基于所述待分析文本时刻和所述语义关联文本时刻,对所述待分析文本和所述语义关联文本按照时间顺序进行排序,得到排序文本;对所述排序文本进行分词处理,获得排序文本分词;对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。

【技术特征摘要】
1.一种文本情感分析方法,其特征在于,包括:获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联的语义关联文本,以及语义关联文本时刻;基于所述待分析文本时刻和所述语义关联文本时刻,对所述待分析文本和所述语义关联文本按照时间顺序进行排序,得到排序文本;对所述排序文本进行分词处理,获得排序文本分词;对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。2.如权利要求1所述的文本情感分析方法,其特征在于,还包括:对所述排序文本分词进行场景关联筛选,得到场景关联文本分词;所述对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数,包括:对所述场景关联文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数。3.如权利要求2所述的文本情感分析方法,其特征在于,所述对所述排序文本分词进行场景关联筛选,得到场景关联文本分词,包括:计算所述排序文本分词与场景文本库中的场景文本的相似度;筛选出所述相似度大于相似度阈值的所述排序文本分词,得到所述场景关联文本分词。4.如权利要求1所述的文本情感分析方法,其特征在于,对所述排序文本分词进行情感极性分数计算,获得所述待分析文本的情感极性分数,包括:在情感分词词典中的查找所述排序文本分词的情感极性分数,所述情感分词词典中包括情感词和修饰所述情感词的修饰词;计算所述情感词和所述修饰词的加权情感分数,获得所述待分析文本的情感极性分数。5.如权利要求1-4任一项所述的文本情感分析方法,其特征在于,所述获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联的语义关联文本,以及语义关联文本时刻,包括:获取所述待分析文本和所述待分析文本时刻;根据所述待分析文本和所述待分析文本时刻,从动态文本库中筛选获得所述语义关联文本及所述语义关联文本时刻,所述动态文本库的文本时刻位于所述待文本时刻前的时间阈值内。6.如权利要求5所述的文本情感分析方法,其特征在于,所述根据所述待分析文本和所述待分析文本时刻,从动态文本库中筛选获得所述语义关联文本及所述语义关联文本时刻,包括:将所述待分析文本转化为待分析文本特征向量,将所述动态文本库中的文本1转化为文本特征向量1,……,文本n转化为文本特征向量n,n≥1,n为整数;设定存储关联向量的关联向量库,所述关联向量包括所述待分析文本特征向量和已获得的语义关联文本特征向量,所述关联向量库包括关联向量库1、关联向量库2、……、关联向量库n,n≥1,n为整数;依次计算所述文本特征向量1和所述关联向量库1中的各所述关联向量的关联度,比较各所述关联度得到最大关联度,所述最大关联度与关联度阈值比较,得到所述最大关联度大于所述关联度阈值的语义关联文本特征向量1,将所述语义关联文本特征向量1存储至所述关联向量库1,得到关联向量库2;以此类推,计算所述文本特征向量n和所述关联向量库n中的各所述关联向量的关联度,比较各所述关联度得到最关联度,所述最大关联度与关联度阈值比较,得到所述最大关联度大于所述关联度阈值的语义关联文本特征向量n,将所述语义关联文本特征向量n存储至所述关联向量库n-1,得到关联向量库n;从所述关联向量库n中获取所有语义关联文本特征向量、所述语义关联文本和所述语义关联文本时刻。7.如权利要求6所述的文本情感分析方法,其特征在于,所述动态文本库中的所述文本包括字符文本和语音文本。8.如权利要求7所述的文本情感分析方法,其特征在于,所述语音文本通过语音识别算法识别为字符文本。9.如权利要求6所述的文本情感分析方法,其特征在于,所述关联度为余弦距离的倒数。10.一种文本情感分析系统,其特征在于,包括:文本及文本时刻获取装置,适于获取待分析文本、待分析文本时刻、与所述待分析文本语义相关联...

【专利技术属性】
技术研发人员:丁华雄张邦鑫黄琰杨松帆陈飞
申请(专利权)人:北京易真学思教育科技有限公司北京新唐思创教育科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1