The present invention relates to an Internet public opinion monitoring method and device, in which the method includes: a classification learning model that trains Internet complaint information according to a pre established expert classification model, classifies the acquired Internet complaint information according to the classified learning model, and obtains the complaint classification information; determines the location of the complaint information; The similarity between the complaint classification information and the user query information is described, and the target Internet complaint information is traced according to the determination results of the similarity degree. The device comprises a learning model training unit, a complaint classification information acquisition unit, a similarity determination unit and an information traceability unit. The method and device of Internet public opinion monitoring and monitoring of the invention can classify and model mass Internet complaints and complain information, and trace the source of information, find the source and time of the complaint information in time, and help to monitor and deal with the Internet public opinion information in time and effectively.
【技术实现步骤摘要】
互联网舆情监控方法及装置
本专利技术涉及通信
,尤其涉及一种互联网舆情监控方法及装置。
技术介绍
互联网时代,移动客户宣泄不满的渠道变广,互联网投诉客户明显增多,网民客户活跃度高,彼此之间的影响力增强,很容易引起聚众效应。许多移动客户通过微博、论坛、大型门户网站、社交APP等平台发布负面信息,影响面不易控制,极易在短时间内迅速蔓延泛滥。经研究发现,几乎每一件造成不良影响的针对运营商的互联网投诉事件,都是由网民组织在互联网上进行大量发布、快速传播导致的。为避免上述种类的投诉带来的负面影响,现有技术中采用例如以下几种技术方案对网络舆情进行分类与识别。具体地,现有技术中的一种方法是,选取已分类的舆情信息文本作为训练文本并分词,根据特征词将训练文本向量化,然后利用PCA变换特征矩阵将待分类舆情信息文本的向量矩阵的向量降维,然后根据BP神经网络模型对其进行变换,得到与分类数量相同维数的输出向量,再用决策树规则进行匹配;现有技术中的另一种方法是,采集互联网舆情文件,并采用预设的专题规则匹配互联网舆情文件;对匹配成功的互联网舆情文件生成专题;现有技术中的第三种方法是,将舆 ...
【技术保护点】
一种互联网舆情监控方法,其特征在于,包括:根据预先建立的专家分类模型训练互联网投诉信息的分类学习模型;根据所述分类学习模型对获取的互联网投诉信息进行分类,以获取投诉分类信息;确定所述投诉分类信息与获取的用户查询信息的相似度;根据所述相似度的确定结果对目标互联网投诉信息进行溯源。
【技术特征摘要】
1.一种互联网舆情监控方法,其特征在于,包括:根据预先建立的专家分类模型训练互联网投诉信息的分类学习模型;根据所述分类学习模型对获取的互联网投诉信息进行分类,以获取投诉分类信息;确定所述投诉分类信息与获取的用户查询信息的相似度;根据所述相似度的确定结果对目标互联网投诉信息进行溯源。2.根据权利要求1所述的方法,其特征在于,所述确定所述投诉分类信息与获取的用户查询信息的相似度,包括:根据所述投诉分类信息建立向量空间模型;获取用户查询信息,并构建所述用户查询信息的文本向量;确定所述向量空间模型中各投诉分类信息的文本向量与所述用户查询信息的文本向量的相似度。3.根据权利要求2所述的方法,其特征在于,所述根据所述相似度的确定结果对目标互联网投诉信息进行溯源,包括:获取所述向量空间模型中的目标文本向量;其中,所述目标文本向量为与所述用户查询信息的文本向量的相似度超过预设阈值的文本向量;根据所述目标文本向量对应的互联网投诉信息的发布时间,确定目标互联网投诉信息的发送源头。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标文本向量对应的互联网投诉信息的发布时间,确定目标互联网投诉信息的发送源头,包括:确定所述目标文本向量对应的互联网投诉信息中发布时间最早的互联网投诉信息;获取所述发布时间最早的互联网投诉信息的发布网址。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述分类学习模型对获取的互联网投诉信息进行分类,包括:采用预先定义的投诉字典以及预先构建的关键词与投诉...
【专利技术属性】
技术研发人员:李艳,
申请(专利权)人:中国移动通信集团湖南有限公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。