【技术实现步骤摘要】
兴趣点的事件挖掘方法及其装置
本专利技术涉及地理信息
,尤其涉及一种兴趣点的事件挖掘方法及其装置。
技术介绍
随着移动互联网时代的到来,电子地图成为了人们出行必备的工具之一。和纸质地图相比,电子地图的提供者能够在电子地图中标注兴趣点的相关信息,方便电子地图的使用者更加详细地了解该兴趣点。比如:在电子地图中标注大型商场由于内部装修而暂停营业的信息。相关信息需要根据与该兴趣点有关的事件及时更新,才能满足用户的使用需求。相关技术中,利用从资讯信息中识别出的关键词在电子地图中检索已有兴趣点。从资讯信息中筛选出与已有兴趣点相似度较高的兴趣点,进而确定该兴趣点对应的事件,事件挖掘的准确率低。而且,由于需要不断地识别资讯信息中的关键词,检索已有兴趣点,无法在海量资讯信息中挖掘事件。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种兴趣点的事件挖掘方法,以实现从资讯信息中抓取兴趣点及兴趣点对应的事件,提高了事件挖掘的效率和准确率本专利技术的第二个目的在于提出一种兴趣点的事件挖掘装置。本专利技术的第三个目的在于提出 ...
【技术保护点】
1.一种兴趣点的事件挖掘方法,其特征在于,包括:获取多个资讯信息;根据预设事件动词集合对所述多个资讯信息进行筛选,其中,所述预设事件动词集合中包括多个事件动词;从筛选之后的资讯信息中提取兴趣点事件句;以及从所述兴趣点事件句中提取兴趣点及所述兴趣点对应的事件。
【技术特征摘要】
1.一种兴趣点的事件挖掘方法,其特征在于,包括:获取多个资讯信息;根据预设事件动词集合对所述多个资讯信息进行筛选,其中,所述预设事件动词集合中包括多个事件动词;从筛选之后的资讯信息中提取兴趣点事件句;以及从所述兴趣点事件句中提取兴趣点及所述兴趣点对应的事件。2.如权利要求1所述的兴趣点的事件挖掘方法,其特征在于,所述根据预设事件动词集合对所述多个资讯信息进行筛选,包括:判断所述资讯信息中是否包括预设城市名称;如果包括所述预设城市名称,则进一步判断所述资讯信息中是否包括所述预设事件动词集合中的至少一个事件动词;如果未包括所述预设城市名称,或未包括所述预设事件动词集合中的至少一个事件动词,则将所述资讯信息筛除。3.如权利要求1或2所述的兴趣点的事件挖掘方法,其特征在于,所述预设事件动词集合中的事件动词通过临近词扩展获得。4.如权利要求1所述的兴趣点的事件挖掘方法,其特征在于,所述从筛选之后的资讯信息中提取兴趣点事件句,包括:将所述筛选之后的资讯信息切分成多个句子;对所述多个句子分别进行识别以判断所述句子是否为兴趣点事件变迁句;以及如果判断为所述兴趣点事件变迁句,则将所述句子作为所述兴趣点事件句。5.如权利要求4所述的兴趣点的事件挖掘方法,其特征在于,如果同时满足以下条件,则判断所述句子为所述兴趣点事件变迁句:所述句子包括组织机构类别的专名数据;所述句子包括兴趣点事件预设动词;且所述句子包括依存句式。6.如权利要求1所述的兴趣点的事件挖掘方法,其特征在于,所述从所述兴趣点事件句中提取兴趣点及所述兴趣点对应的事件,包括:通过兴趣点专名抽取模型从所述兴趣点事件句中提取所述兴趣点;从所述兴趣点事件句中提取所述兴趣点对应的事件,以及所述事件对应的相关时间;根据所述事件对应的相关时间生成所述事件的生效时间;根据所述生效时间修改地图中所述兴趣点的事件。7.如权利要求6所述的兴趣点的事件挖掘方法,其特征在于,所述兴趣点专名抽取模型通过以下步骤训练获得:获取检索词历史数据,其中,所述检索词历史数据包括多个检索词;获取所述检索词历史数据中每个检索词对应的关联兴趣点;获取兴趣点-新闻句子对历史集合,其中,所述兴趣点-新闻句子对历史集合中包括多个兴趣点-新闻句子对;使用长短期记忆网络对所述兴趣点-新闻句子对中的新闻句子进行序列标注,以获取所述新闻句子的序列标注结果;使用条件随机场对所述新闻句子的序列标注结果进行修正;对所述兴趣点-新闻句子对中的兴趣点进行序列标注,并根据所述兴趣点和所述新闻句子的序列标注结果,训练所述长短期记忆网络和所述条件随机场。8.一种兴趣点的事件挖掘装置,其特征在于,所述装置包括:获取模块,用于获取多个资讯信息;筛选模块,用于根据预设事件动词集合对所述多个资讯信息进行筛选,其中,所述预设事件动词集合中包括多个事件动词;第一提取模块,用于从筛选之后的资讯信息中提取兴趣点事件句;以...
【专利技术属性】
技术研发人员:陈文浩,郑宇宏,周辉,陈玉光,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。