【技术实现步骤摘要】
相似事件查询的方法、装置、存储介质和终端设备
本专利技术涉及计算机
,尤其涉及一种相似事件查询的方法、装置、存储介质和终端设备。
技术介绍
舆情分析是根据特定的问题或事件的需要,对针对这个问题的舆情进行深层次的思维加工和分析研究,得到相关结论的过程。在舆情分析和处置的过程中,如果能有相似事件做参考,对媒体工作者来说,可以丰富素材,写出更有深度的报道。以及对于事件中的当事方,可以学习前人的经验教训,更好的处置事件,将损失降到最低。例如:北京单位A发生事件C。如果通过相似事件的召回,可以发现:在此事件发生之前,在上海单位B发生了一起事件C。对媒体、相关管理部门来,可以参考单位B发生的事件C的舆情处置的情况,来对单位A发生的事件C进行舆情分析和处置。目前,业内对事件的处理,一般是对事件或者话题的进行追踪。但是,事件或话题的追踪主要是对同一个事件或话题在不同时间段进行分析,与相似事件的概念不同。对于相似事件的召回,通常的做法是:根据文本相似度对事件聚类。例如,根据事件名称,进行两两计算事件的相似度。但是上述通过 ...
【技术保护点】
1.一种相似事件查询的方法,其特征在于,包括:/n根据待查询事件的主题类别,从事件库中获取与所述主题类别相匹配的事件,获得主题事件集合;其中,所述事件库包括多个事件,每个事件包括事件的主题类别、触发词和事件特征;/n根据所述待查询事件的触发词,判断所述主题事件集合是否包括与所述触发词相匹配的事件;以及/n当所述主题事件集合包括与所述触发词匹配的事件时,根据所述待查询事件的事件特征,从所述主题事件集合中获取与所述待查询事件相似的事件。/n
【技术特征摘要】
1.一种相似事件查询的方法,其特征在于,包括:
根据待查询事件的主题类别,从事件库中获取与所述主题类别相匹配的事件,获得主题事件集合;其中,所述事件库包括多个事件,每个事件包括事件的主题类别、触发词和事件特征;
根据所述待查询事件的触发词,判断所述主题事件集合是否包括与所述触发词相匹配的事件;以及
当所述主题事件集合包括与所述触发词匹配的事件时,根据所述待查询事件的事件特征,从所述主题事件集合中获取与所述待查询事件相似的事件。
2.如权利要求1所述的相似事件查询的方法,其特征在于,所述根据所述待查询事件的触发词和事件特征,从所述主题事件集合中获取与所述待查询事件相似的事件,包括:
根据所述待查询事件的触发词,从所述主题事件集合中选取与所述触发词相匹配的事件,获得触发事件集合;
根据所述待查询事件的事件特征,计算所述待查询事件与所述触发事件集合中每个事件的相似度;以及
根据所述待查询事件与所述触发事件集合中每个事件的相似度,从所述触发事件集合中选取与所述待查询事件相似的事件。
3.如权利要求1所述的相似事件查询的方法,其特征于,所述方法还包括:
当所述主题事件集合不包括与所述触发词相匹配的事件时,根据所述待查询事件的触发词和事件特征,从所述事件库中获取与所述待查询事件相似的事件。
4.如权利要求3所述的相似事件查询的方法,其特征在于,所述根据所述待查询事件的触发词和事件特征,从所述事件库中获取与所述待查询事件相似的事件,包括:
根据所述待查询事件的触发词,从所述事件库中获取与所述触发词相匹配的事件,获得触发事件集合;
根据所述待查询事件的事件特征,计算所述待查询事件与所述触发事件集合中每个事件的相似度;以及
根据所述待查询事件与所述触发事件集中每个事件的相似度,从所述触发事件集合中选取与所述待查询事件相似的事件。
5.如权利要求2或4所述的相似事件查询的方法,其特征在于,所述根据所述待查询事件的事件特征,计算所述待查询事件与所述触发事件集合中每个事件的相似度,包括:
分别设置所述待查询事件的每一类特征对应的权重值;
对于所述每一类特征,分别计算所述待查询事件与所述触发事件集合中每个事件之间的特征相似度;
对于所述触发事件集合中的每个事件,根据所述事件的每一类特征对应的权重值,以及所述事件与所述待查询事件之间的特征相似度,计算获得所述事件与所述待查询事件的相似度。
6.如权利要求1所述的相似事件查询的方法,其特征在于,所述方法还包括:
对所述待查询事件的事件标题进行分词,并从中抽取包含动作的词语,并添加到触发词库中。
7.如权利要求1所述的相似事件查询的方法,其特征在于,所述方法还包括:
从互联网中实时收集资讯数据;
对收集到的资讯数据进行预处理,获得待收集的事件;
确定所述待收集的事件的主题类别、触发词和事件特征;以及
根据所述待收集的事件的标识与所述待收集的事件的主题类别、触发词和事件特征...
【专利技术属性】
技术研发人员:韦庭,潘旭,尹存祥,雍倩,吴伟佳,崔路男,李云聪,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。