【技术实现步骤摘要】
一种移动APP特定事件内容检测方法与装置
[0001]本专利技术涉及网络信息安全和自然语言处理交叉
,尤其涉及一种 移动APP特定事件内容检测方法与装置。
技术介绍
[0002]截至2019年6月,我国网民规模达8.54亿,我国手机网民规模达8.47 亿,网民使用手机上网的比例达99.1%。移动APP正取代传统报纸、网页作 为新闻资讯获取的主要源头和时事讨论的主要阵地。同时各家APP由于编 辑人员不同、用户群体不同、思维角度不同对同一事件相关报道的展现通常 有所差异,因此,要全面掌握某个舆论事件的发展趋势,需要获取各个移动 APP在舆论事件内容上的推送情况。
[0003]对于移动APP,在获取某一事件的内容时通过检索获取要比遍历全部内 容后过滤的方案具有更高的可行性和更低的成本。因此,进行热点事件内容 获取时,采用相关技术在APP中自动化检索相关关键词的方式完成更具有 可行性。
[0004]随着事态发展与观察角度变化,同一事件通常具有较多关键词,例如“腾 讯起诉老干妈”事件中,“腾讯”、“老干妈”、“公 ...
【技术保护点】
【技术特征摘要】
1.一种移动APP特定事件内容检测方法,其特征在于,S1、获取特定事件的若干内容作为原始语料,从原始语料中抽取关键词,构建针对特定事件的原始关键词库;S2、针对特定事件内容的原始语料,构建关键词在该原始语料中的关系图,即关键词关系图,并对关键词关系图进行聚类,得到若干簇;S3、对同一簇中的关键词进行量化和排序,得到最能够表达该事件的关键词组,称之为特征关键词;S4、在得到各个簇的特征关键词之后,将特征关键词逐一或通过一定策略部分组合输入到APP搜索框中进行自动化检索,以图像或文本的形式保存结果;S5、使用机器学习算法对保存结果进行分析,判断验证保存结果是否属于特定事件的相关内容。2.根据权利要求1所述的移动APP特定事件内容检测方法,其特征在于,所述关键词关系图为有向图G={V,E},V是图中节点的集合,每个关键词是一个节点。E是图中边的集合,每条边的权重代表一个关键词在另一个关键词出现时也出现的概率。3.根据权利要求1或2所述的移动APP特定事件内容检测方法,其特征在于,所述对关键词关系图进行聚类,是选择谱聚类的方法将所有关键词划分为若干个内部具有关联性的簇。4.根据权利要求1或2所述的移动APP特定事件内容检测方法,其特征在于,所述对同一簇中的关键词进行量化和排序,所述量化是指计算每个簇中每个关键词即每个节点的权重;记W(V
i
)为节点V
i
的权重,则:其中w
ij
为节点V
i
与节点V
j
之间有向边权重;所述排序是指按照上述计算得到的权重值,由大到小进行排序。5.根据权利要求1或2所述的移动APP特定事件内容检测方法,其特征在于,所述将特征关键词逐一或通过一定策略部分组合输入到APP搜索框中进行自动化检索,若根据单一关键词进行检索的结果与实际事件关联度过低,则在单次检索中通过添加关键词的方式精确匹配;若在单次搜索中使用单一关键词的结果为空,则删除该关键词,后续的检索过程中不再采用。6.一种移动...
【专利技术属性】
技术研发人员:李鹏霄,王海洋,翟羽佳,项菲,彭成维,马宏远,王红兵,时磊,赵媛,鲁睿,隋明爽,李雪梅,李真,张旋,王丽萍,徐健,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。