【技术实现步骤摘要】
一种情感倾向分析方法及系统
[0001]本申请涉及情感倾向分析
,尤其涉及一种情感倾向分析方法及系统。
技术介绍
[0002]随着科技的进步与社会的发展,股票市场已经在我国现代金融体系中占主导地位,网络用户作为信息网络的主力军也越发倾向于在一系列社交网络平台上交流个人经验、抒发自身情感,逐步由资源信息查阅者向数据资源分享者的角色转变。用户个体发表的金融股票评论、新闻时事评论等舆情信息,在一定程度上促进了互联网线上数据的蓬勃发展,加快了网络舆情数据的繁衍与裂变。在互联网急剧扩展的浪潮中股民投资者作为股票市场的重要组成部分已经发展为网络在线分享交流股市资讯的重要参与者之一,由此产生的股评舆情数据对股票市场的发展带来了不可忽视的影响。对股票的预测方法一般分为技术分析与基本面分析两种。技术分析基于对股市运行所积累的结构化数据对未来走势进行分析预测,因为影响股价的所有因素都集中反映在历史数据中,因此对历史数据进行充分分析便可以较好地预测股票的发展势头;基本面分析则多使用非结构化文本数据,数据来源更广也更复杂,其着重分析影响股市的 ...
【技术保护点】
【技术特征摘要】
1.一种情感倾向分析方法,其特征在于,包括:爬取步骤:爬取舆情文本,获取爬取后的舆情文本;预处理步骤:预处理爬取后的所述舆情文本,获取预处理后的舆情文本;获取步骤:使用预处理后的所述舆情文本,获取word2vec词向量模型后,对所述word2vec词向量模型中的向量进行情感倾向分类,获取情感倾向分类器;分析步骤:通过所述情感倾向分类器去分析实时舆情文本的情感倾向。2.根据权利要求1所述的情感倾向分析方法,其特征在于,所述爬取步骤包括,选取所述舆情文本作为挖掘与分析的对象,并爬取所述舆情文本,获取爬取后的所述舆情文本。3.根据权利要求1所述的情感倾向分析方法,其特征在于,所述预处理步骤包括,对爬取后的所述舆情文本进行清洗、去噪、分词、去除停用词操作后,获取预处理后的所述舆情文本。4.根据权利要求1所述的情感倾向分析方法,其特征在于,所述获取步骤包括,使用预处理后的所述舆情文本,训练word2vec模型后,使用所述word2vec模型将预处理后的所述舆情文本中的词转换为向量,并获取所述word2vec词向量模型后,对所述word2vec词向量模型中的所述向量进行情感倾向分类,将情感倾向分类后的所述向量分为训练集与测试集,并根据所述训练集与所述测试集获取所述情感倾向分类器。5.根据权利要求1所述的情感倾向分析方法,其特征在于,所述分析步骤包括,根据一个所述实时舆情文本,通过所述情感倾向分类器分析所述实时舆情文本的所述情感倾向。6.一种情感倾向分析系统,其特征在于,适用...
【专利技术属性】
技术研发人员:潘钰,刘远,杨森,
申请(专利权)人:北京明略昭辉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。