【技术实现步骤摘要】
基于知识图谱的热点话题追溯方法及装置
本专利技术涉及互联网领域,尤其涉及一种基于知识图谱的热点话题追溯方法及装置。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着互联网的快速发展,用户能够通过互联网获取的资讯信息量呈现爆发式增长,为了提高资讯内容的阅读效率,快速提取到有效信息,可以根据某一时间段内的资讯信息构建一个或多个热点话题,使得用户能够快速追溯其关注的热点话题关联的资讯信息。然而,随着历史热点话题资讯数据的积累,对于某个热点话题,除了构建热点话题时直接关联到该热点话题的一个或多个资讯事件的资讯信息,历史积累资讯数据中可能有一些资讯事件是与该热点话题相关的,但是由于其发生时间较早,已经被关联到历史热点话题中,因而,急需一种能够查找与待追溯热点话题关联的历史相似资讯事件,以便追溯到更全面地资讯信息。目前,现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,通过这种方式搜出的资讯信息是海量的,无法快速追溯到某个热点话题 ...
【技术保护点】
1.一种基于知识图谱的热点话题追溯方法,其特征在于,包括:/n获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,所述待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;/n根据所述待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找所述待追溯热点话题关联的一个或多个历史资讯事件,其中,所述知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系;/n采集所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;/n输出所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。/n
【技术特征摘要】
1.一种基于知识图谱的热点话题追溯方法,其特征在于,包括:
获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,所述待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;
根据所述待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找所述待追溯热点话题关联的一个或多个历史资讯事件,其中,所述知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系;
采集所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;
输出所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
2.如权利要求1所述的方法,其特征在于,根据所述待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找所述待追溯热点话题关联的一个或多个历史资讯事件,包括:
根据所述待追溯热点话题关联的各个资讯事件的事件信息,从知识图谱中查找与所述待追溯热点话题关联各个资讯事件的相似度高于预设阈值的一个或多个资讯事件,并将相似度高于预设阈值的一个或多个资讯事件确定为所述待追溯热点话题关联的历史资讯事件;
根据相似度高于预设阈值的各个资讯事件的事件信息,从知识图谱中查找相似度高于预设阈值的各个资讯事件关联的热点话题,将查找到的热点话题确定为所述待追溯热点话题的相似热点话题,并将相似热点话题关联的各个资讯事件确定为所述待追溯热点话题关联的历史资讯事件。
3.如权利要求2所述的方法,其特征在于,每个资讯事件的事件信息至少包含每个资讯事件的标题和概要内容,所述方法还包括:
将所述待追溯热点话题关联各个资讯事件的标题与知识图谱中各个热点话题关联的各个资讯事件的标题进行比对,计算第一相似度;
将所述待追溯热点话题关联各个资讯事件的概要内容与知识图谱中各个热点话题关联各个资讯事件的概要内容进行比对,计算第二相似度;
根据所述第一相似度和/或第二相似度,确定知识图谱中各个资讯事件与所述待追溯热点话题关联各个资讯事件的相似度。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
根据各个资讯事件的事件信息,提取各个资讯事件的标题和概要内容。
5.如权利要求4所述的方法,其特征在于,根据各个资讯事件的事件信息,提取各个资讯事件的标题和概要内容,包括:
采集每个资讯事件关联的各个资讯的热度信息;
根据每个资讯事件关联的各个资讯的热度信息,计算每个资讯事件关联的各个资讯的热度指标;
根据最大热度指标对应的资讯,提取每个资讯事件的标题和概要内容。
6.如权利要求4所述的方法,其特征在于,根据各个资讯事件的事件信息,确定各个资讯事件的标题和概要内容,包括:
统计每个资讯事件关联的各个资讯中预设关键词的出现次数;
根据预设关键词出现最多次数的资讯,提取每个资讯事件的标题和概要内容。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
采集多个资讯平台的资讯信息;
根据多个资讯平台的资讯信息,构建一个或多个热点话题。
8.如权利要求7所述的方法,其特征在于,根据多个资讯平台的资讯信息,构建一个或多个热点话题,包括:
将多个资讯平台的资讯信息归类为一个或多个资讯话题;
实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题关联所有资讯的点击数、点赞数或评论数;
监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;
将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
9.如权利要求8所述的方法,其特征在于,所述方法还包括:
监测每个热点话题的持续时间段;
根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
10.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据各个资讯事件关联的资讯信息,统计各个资讯事件的热度信息;
根据各个资讯事件的热度信息,计算各个资讯事件的热度指标;
根据所述待追溯热点话题关联各个资讯事件的热度指标,绘制所述待追溯热点话题的热度曲线;
展示所述待追溯热点话题的热度曲线。
11.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述待追溯热点话题和所述待追溯热点话题关联的各个资讯事件,从知识图谱中查询所述待追溯热点话题关联一个或多个金融市场产品;
采集所述待追溯热点话题关联一个或多个金融市场产品的价格数据;
根据所述待追溯热点话题关联各个金融市场产品的价格数据,绘制所述待追溯热点话题关联各个金融市场产品在所述待追溯热点话题持续时间段内的价格曲线;
展示所述待追溯热点话题关联各...
【专利技术属性】
技术研发人员:金业,闫佳丽,崔华,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。