【技术实现步骤摘要】
一种社交媒体评论的情感分析方法、设备及其存储设备
本专利技术涉及网络信息处理领域,具体涉及一种社交媒体评论的情感分析方法、设备及其存储设备。
技术介绍
在新闻类社交媒体上,用户往往会就一些热门事件留下自己的评论,例如前段时间的“萨德”事件,目前的印度事件等。但用户的评论信息中可能会存在误导大众或具有威胁性的内容,类似的评论数据如果在社交媒体平台上长时间留存,可能造成不必要的舆论恐慌。因此,及时监控社交媒体平台上用户评论内容中具有威胁性或误导性的内容,并对这些内容进行快速、精确地处理就成为亟待解决的问题。
技术实现思路
为了解决上述问题,本专利技术提供了一种社交媒体评论的情感分析方法、设备及其存储设备,首先通过采用Python爬虫程序采集待处理数据信息,然后结合MySQL数据库对采集到的数据进行预处理,最后利用贝叶斯理论训练分类器,可以有效解决上述问题。本专利技术提供的技术方案是:一种社交媒体评论的情感分析方法,所述方法包括步骤:用特定程序获取用户评论信息;使用数据库处理获取的用户评论信息并将该信息分为训练集和测试集;对所述训练集和测试集分别进行预处理并提取特征词;设置 ...
【技术保护点】
一种社交媒体评论的情感分析方法,所述方法由一种社交媒体评论的情感分析设备实现,其特征在于:包括以下步骤:用特定程序获取用户评论信息;使用数据库处理获取的用户评论信息并将该信息分为训练集和测试集;对所述训练集和测试集分别进行预处理并提取特征词;设置情感分类等级及阈值,使用贝叶斯方法结合训练集进行训练得到分类器;用所述分类器对测试集进行分类并输出分类结果;删除分类结果中感情分类等级低于阈值的评论。
【技术特征摘要】
1.一种社交媒体评论的情感分析方法,所述方法由一种社交媒体评论的情感分析设备实现,其特征在于:包括以下步骤:用特定程序获取用户评论信息;使用数据库处理获取的用户评论信息并将该信息分为训练集和测试集;对所述训练集和测试集分别进行预处理并提取特征词;设置情感分类等级及阈值,使用贝叶斯方法结合训练集进行训练得到分类器;用所述分类器对测试集进行分类并输出分类结果;删除分类结果中感情分类等级低于阈值的评论。2.如权利要求1所述的一种社交媒体评论的情感分析方法,其特征在于:所述用特定程序获取用户评论信息的步骤具体包括:所述特定程序为Python爬虫程序,所述特定程序获取社交媒体用于存储评论的服务器地址;设定新闻事件的热度排名阈值;根据所述热度排名阈值获取评论;按新闻主题分类存储获取的评论。3.如权利要求1所述的一种社交媒体评论的情感分析方法,其特征在于:所述使用数据库处理获取的用户评论信息并将该信息分为训练集和测试集的具体步骤包括:所述数据库为MySQL数据库;所述MySQL数据库分为8个字段,分别为:评论获点赞数目记为numofzan、评论发表时间记为createtime、用户名记为username、用户ID记为userid、该评论被评论的数目记为replycount、评论内容记为commenttext、新闻主题ID记为group_id和评论的ID记为onlyid;所述onlyid是评论的唯一标识;使用SQL语句将获取的用户评论中的评论数据进行去重操作;去重后的评论数据记为comment_nonrepetitive;将所述comment_nonrepetitive分为训练集和测试集。4.如权利要求3所述的一种社交媒体评论的情感分析方法,其特征在于:对所述训练集和测试集分别进行预处理并提取特征词的具体步骤包括:去除训练集中每条评论的标记信息以及转发人的评论内容,只保留该ID所作的评论;将上述步骤处理后的评论记为comment_personal;保留每条评论数据的onlyid字段;对comment_personal进行jieba分词,包括:基于Trie树结构实现高效的词图扫描;生成评论中汉字所有成词情况;构成有向无环图(DAG)记...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。