一种基于情感分析的数据处理方法和装置制造方法及图纸

技术编号:17705227 阅读:71 留言:0更新日期:2018-04-14 18:06
本发明专利技术提供了一种基于情感分析的数据处理方法和装置,涉及计算机技术领域,所述方法包括:获得原始文本数据库,所述原始文本数据库中包含文本数据;获得情感分析词典;根据所述情感分析词典,获得第一情感权值;获得在线序列‑极限学习机模型;根据所述在线序列‑极限学习机模型,动态调整预测模型,获得第二情感权值;根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。解决了现有技术中无法实现对实时网络数据流快速、准确的情感分析的技术问题。达到了基于大数据平台,实现对海量文本进行准实时的情感分析处理的技术效果。

【技术实现步骤摘要】
一种基于情感分析的数据处理方法和装置
本专利技术涉及信息处理
,尤其涉及一种基于情感分析的数据处理方法和装置。
技术介绍
现有技术中常用的计算平台中的数据具有海量性、实时性和动态变化性的特点,所以数据平台的处理任务大小也具备动态变化特征,同样企业中对于数据流计算的查询也是动态变化的。但本申请专利技术人在实现本申请实施例中专利技术技术方案的过程中,发现上述技术至少存在如下技术问题:现有技术无法实现对实时网络数据流快速、准确的情感分析的技术问题。
技术实现思路
本专利技术实施例提供了一种基于情感分析的数据处理方法和装置,解决了现有技术中无法实现对实时网络数据流快速、准确的情感分析的技术问题。鉴于上述问题,提出了本申请实施例以便提供一种基于情感分析的数据处理方法和装置。第一方面,本专利技术提供了一种基于情感分析的数据处理方法,所述方法包括:获得原始文本数据库,所述原始文本数据库中包含文本数据;获得情感分析词典;根据所述情感分析词典,获得第一情感权值;获得在线序列-极限学习机模型;根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。结合第一方面,在第一方面的第一种可能的实现方式中,所述根据所述情感分析词典,获得第一情感权值,具体包括:根据所述情感分析词典,获得情感分数;根据所述情感分数,判断情感极性;根据所述文本数据,获得第一词语集合;去除所述第一词语集合中的停留词,获得第二词语集合;根据所述情感分数、所述情感极性、所述第二词语集合,获得所述第一情感权值。结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述情感分数,判断情感极性,具体包括:如果所述情感分数大于零,判断所述情感极性为正;如果所述情感分数小于零,判断所述情感极性为负。结合第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述第二词语集合包括否定词和/或程度副词和/或情感词。结合第一方面,在第一方面的第四种可能的实施方式中,所述根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值,具体包括:根据所述文本数据,获得第三词语集合;去除所述第三词语集合中的停留词,获得第四词语集合;根据所述第四词语集合,获得词向量;获得所述词向量的主成分;获得在线序列-极限学习机模型;根据所述主成分、所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值。结合第一方面,在第一方面的第五种可能的实施方式中,所述根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值,具体包括:根据所述情感分析词典,获得情感参数;根据所述情感参数、所述第一情感权值、所述第二情感权值,确定所述第三情感权值。结合第一方面的第五种可能的实施方式,在第一方面的第六种可能的实施方式中,所述情感参数范围为0~1。第二方面,本专利技术提供了一种基于情感分析的数据处理装置,所述装置包括:第一获得单元,所述第一获得单元用于获得原始文本数据库,所述原始文本数据库中包含文本数据;第二获得单元,所述第二获得单元用于获得情感分析词典;第三获得单元,所述第三获得单元用于根据所述情感分析词典,获得第一情感权值;第四获得单元,所述第四获得单元用于获得在线序列-极限学习机模型;第五获得单元,所述第五获得单元用于根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;第一确定单元,所述第一确定单元用于根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。结合第二方面,在第二方面的第一种可能的实现方式中,所述第三获得单元具体包括:第六获得单元,所述第六获得单元用于根据所述情感分析词典,获得情感分数;第一判断单元,所述第一判断单元用于根据所述情感分数,判断情感极性;第七获得单元,所述第七获得单元用于根据所述文本数据,获得第一词语集合;第八获得单元,所述第八获得单元用于去除所述第一词语集合中的停留词,获得第二词语集合;第九获得单元,所述第九获得单元用于根据所述情感分数、所述情感极性、所述第二词语集合,获得所述第一情感权值。结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第一判断单元具体包括:第二判断单元,所述第二判断单元用于如果所述情感分数大于零,判断所述情感极性为正;第三判断单元,所述第三判断单元用于如果所述情感分数小于零,判断所述情感极性为负。结合第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述第二词语集合包括否定词和/或程度副词和/或情感词。结合第二方面,在第二方面的第四种可能的实现方式中,所述第五获得单元具体包括:第十获得单元,所述第十获得单元用于根据所述文本数据,获得第三词语集合;第十一获得单元,所述第十一获得单元用于去除所述第三词语集合中的停留词,获得第四词语集合;第十二获得单元,所述第十二获得单元用于根据所述第四词语集合,获得词向量;第十三获得单元,所述第十三获得单元用于获得所述词向量的主成分;第十四获得单元,所述第十四获得单元用于获得在线序列-极限学习机模型;第十五获得单元,所述第十五获得单元用于根据所述主成分、所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值。结合第二方面,在第二方面的第五种可能的实现方式中,所述第一确定单元具体包括:第十六获得单元,所述第十六获得单元用于根据所述情感分析词典,获得情感参数;第二确定单元,所述第二确定单元用于根据所述情感参数、所述第一情感权值、所述第二情感权值,确定所述第三情感权值。结合第二方面的第五种可能的实现方式,在第二方面的第六种可能的实现方式中,所述情感参数范围为0~1。第三方面,本专利技术提供了一种基于情感分析的数据处理装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:获得原始文本数据库,所述原始文本数据库中包含文本数据;获得情感分析词典;根据所述情感分析词典,获得第一情感权值;获得在线序列-极限学习机模型;根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:1.本申请实施例提供的一种基于情感分析的数据处理方法和装置,通过获得原始文本数据库,所述原始文本数据库中包含文本数据;获得情感分析词典;根据所述情感分析词典,获得第一情感权值;获得在线序列-极限学习机模型;根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。解决了现有技术中无法实现对实时网络数据流快速、准确的情感分析的技术问题。达到了基于大数据平台,实现对海量文本进行准实时的情感分析处理的技术效果。2.本申请实施例通过根据所述情感分析词典,获得情感分数;根据所述情感分数,判断情感极性;根据所述文本数据,获得第一词语集合;去除所述第一词语集合中的停留词,获得第二词语集合;根据所述情感分数、所述情感极性、所述第二词语集合,获得所述第一情感权值。解决了现有技术中无法实现对实时网络数据流快速、准确的情感分析本文档来自技高网...
一种基于情感分析的数据处理方法和装置

【技术保护点】
一种基于情感分析的数据处理方法,其特征在于,所述方法包括:获得原始文本数据库,所述原始文本数据库中包含文本数据;获得情感分析词典;根据所述情感分析词典,获得第一情感权值;获得在线序列‑极限学习机模型;根据所述在线序列‑极限学习机模型,动态调整预测模型,获得第二情感权值;根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。

【技术特征摘要】
1.一种基于情感分析的数据处理方法,其特征在于,所述方法包括:获得原始文本数据库,所述原始文本数据库中包含文本数据;获得情感分析词典;根据所述情感分析词典,获得第一情感权值;获得在线序列-极限学习机模型;根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。2.如权利要求1所述的方法,其特征在于,所述根据所述情感分析词典,获得第一情感权值,具体包括:根据所述情感分析词典,获得情感分数;根据所述情感分数,判断情感极性;根据所述文本数据,获得第一词语集合;去除所述第一词语集合中的停留词,获得第二词语集合;根据所述情感分数、所述情感极性、所述第二词语集合,获得所述第一情感权值。3.如权利要求2所述的方法,其特征在于,所述根据所述情感分数,判断情感极性,具体包括:如果所述情感分数大于零,判断所述情感极性为正;如果所述情感分数小于零,判断所述情感极性为负。4.如权利要求2所述的方法,其特征在于,所述第二词语集合包括否定词和/或程度副词和/或情感词。5.如权利要求1所述的方法,其特征在于,所述根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值,具体包括:根据所述文本数据,获得第三词语集合;去除所述第三词语集合中的停留词,获得第四词语集合;根据所述第四词语集合,获得词向量;获得所述词向量的主成分;获得在线序列-极限学习机模型;根据所述主成分、所述在线序列-极限学习机模型,动态调整预测...

【专利技术属性】
技术研发人员:李哲君卫华飞刘欢程瑞辉
申请(专利权)人:陕西识代运筹信息科技股份有限公司
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1