多源售票数据管理方法及系统、服务器和计算机可读介质技术方案

技术编号:22135271 阅读:27 留言:0更新日期:2019-09-18 08:59
本发明专利技术公开了一种多源售票数据管理方法,包括:获取多家资源方的多条原始电影售票数据;对原始电影售票数据进行结构化处理,以转变为具有预定结构的结构化电影售票数据;针对每条结构化电影售票数据,对该结构化电影售票数据进行实体化,生成对应的电影资源方实体图谱;针对每个电影资源方实体图谱,从预定的影视剧知识图谱库中确定出与该电影资源方实体图谱对应的相似影视图谱,并分别计算该电影资源方实体图谱中的第一实体与各相似影视图谱中的影视实体之间的属性相似度,且比较属性相似度中的最大值是否大于预定阈值,当比较出该最大值大于预定阈值时,则将该电影资源方实体图谱中的第二实体及其属性值融合至对应的标定影视图谱。

Multi-source Ticketing Data Management Method and System, Server and Computer Readable Media

【技术实现步骤摘要】
多源售票数据管理方法及系统、服务器和计算机可读介质
本专利技术涉及数据融合领域,特别涉及多源售票数据管理方法及系统、服务器和计算机可读介质。
技术介绍
当前,电影售票信息多为各资源方单独提供的,用户可以选择某一家的购票软件查询相应的售票信息;因此,用户需要对比多家资源方的售票信息(例如,针对某个电影的票价)时,需要不断在应用(APP)之间进行切换并进行对比、选择,从而用户体验较差。因此,如何实现多源售票信息的融合,成为亟需解决的技术问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一,提出了一种多源售票数据管理方法及系统、服务器和计算机可读介质。第一方面,本公开实施例提供了一种多源售票数据管理方法,包括:获取多家资源方的多条原始电影售票数据;对所述原始电影售票数据进行结构化处理,以转变为具有预定结构的结构化电影售票数据,所述结构化电影售票数据包括:电影名称、至少一项电影关联信息、资源方信息以及资源方分别在不同城市的售票信息;针对每条所述结构化电影售票数据,以该结构化电影售票数据中的所述电影名称和所述资源方信息分别作为第一实体和第二实体,对该结构化电影售票数据进行实体化,生成对应的电影资源方实体图谱,其中,所述第二实体作为所述第一实体的附属实体,各项所述电影相关信息作为所述第一实体的属性值,各所述售票信息作为所述第二实体的属性值;针对每个所述电影资源方实体图谱,从预定的影视剧知识图谱库中确定出与该电影资源方实体图谱中的第一实体相关联的影视实体所对应的影视图谱,以作为相似影视图谱,并分别计算该电影资源方实体图谱中的所述第一实体与各所述相似影视图谱中的影视实体之间的属性相似度,且比较所述属性相似度中的最大值是否大于预定阈值,其中,当比较出该最大值大于所述预定阈值时,则以该最大值所对应的相似影视图谱作为该电影资源方实体图谱对应的标定影视图谱,将该电影资源方实体图谱中的所述第二实体及其属性值融合至对应的所述标定影视图谱。在一些实施例中,在完成对全部所述电影资源方实体图谱的处理之后,还包括:针对所述影视剧知识图谱库中的每个所述标定影视图谱,在该所述标定影视图谱中,以城市为维度对各资源方分别在不同城市的所述售票信息进行分类,并建立以城市作为第三实体的节点,各资源方分别在不同城市的所述售票信息作为对应的所述第三实体的属性值。在一些实施例中,在完成对全部所述标定影视图谱的处理之后,还包括:接收查询请求,所述查询请求包括:待查电影名称以及待查城市;从所述影视剧知识图谱库中定位出影视实体所对应的电影名称为所述待查电影名称的影视图谱;从所定位到的所述影视图谱中定位出城市为所述待查城市的第三实体,并基于所定位到的第三实体,查询出该第三实体的全部属性以及属性值;将查询结果进行反馈。在一些实施例中,在所述获取多家资源方的多条原始电影售票数据的步骤之后,且在所述对所述原始电影售票数据进行结构化处理的步骤之前,还包括:针对每条所述原始电影售票数据,对该原始电影售票数据进行数据有效性验证,其中,当该原始电影售票数据未通过验证时,则将该原始电影售票数据丢弃。在一些实施例中,所述对该原始电影售票数据进行数据有效性验证的步骤具体包括:检测该原始电影售票数据中是否包含有所述电影名称、所述资源方信息、所述资源方在不同城市的售票信息以及预定电影关联信息;其中,当检测出该原始电影售票数据中包含有所述电影名称、所述资源方信息、所述资源方在不同城市的售票信息以及预定电影关联信息时,则该所述该原始电影售票数据通过有效性验证;当检测出该原始电影售票数据中缺少所述电影名称、所述资源方信息、所述资源方在不同城市的售票信息以及预定电影关联信息中的至少一者时,则该所述该原始电影售票数据未通过有效性验证。在一些实施例中,所述从预定的影视剧知识图谱库中确定出与该电影资源方实体图谱中的第一实体相关联的影视实体所对应的影视图谱,以作为相似影视图谱的步骤具体包括:获取该电影资源方实体图谱中的第一实体所对应的电影名称以及该电影名称的别名,统称为电影可选名称;从所述影视剧知识图谱库中筛选出影视实体所对应的电影名称为所述电影可选名称的影视图谱,筛选出的影视图谱作为该电影资源方实体图谱对应的相似影视图谱。在一些实施例中,基于如下式子计算所述电影资源方实体图谱中的所述第一实体与所述相似影视图谱中的影视实体之间的属性相似度:其中,Qa,b表示所述电影资源方实体图谱中的所述第一实体与所述相似影视图谱中的影视实体之间的属性相似度,n表示预定用于计算属性相似度的n个属性,ai表示所述电影资源方实体图谱中的所述第一实体所对应的预定用于计算属性相似度的n个属性中的第i个属性的属性值,bi表示所述相似影视图谱中的所述影视实体所对应的预定用于计算属性相似度的n个属性中的第i个属性的属性值,S(ai,bi)表示属性值ai与属性值bi之间的相似度,pi表示S(ai,bi)所对应的权值。在一些实施例中,所述预定用于计算属性相似度的属性包括:上映年份、导演和演员表中的至少一者。在一些实施例中,所述获取多家资源方的多条原始电影售票数据的步骤具体包括:从多家资源方处抓取所述原始电影售票数据;和/或,接收多家资源方所推送的所述原始电影售票数据。第二方面,本公开实施例提供了一种多源售票数据管理系统,包括:获取模块,用于获取多家资源方的多条原始电影售票数据;处理模块,用于对所述原始电影售票数据进行结构化处理,以转变为具有预定结构的结构化电影售票数据,所述结构化电影售票数据包括:电影名称、至少一项电影关联信息、资源方信息以及资源方分别在不同城市的售票信息;实体化模块,用于针对每条所述结构化电影售票数据,以该结构化电影售票数据中的所述电影名称和所述资源方信息分别作为第一实体和第二实体,对该结构化电影售票数据进行实体化,生成对应的电影资源方实体图谱,其中,所述第二实体作为所述第一实体的附属实体,各项所述电影相关信息作为所述第一实体的属性值,各所述售票信息作为所述第二实体的属性值;确定模块,用于针对每个所述电影资源方实体图谱,从预定的影视剧知识图谱库中确定出与该电影资源方实体图谱中的第一实体相关联的影视实体所对应的影视图谱,以作为相似影视图谱;计算比较模块,分别计算该电影资源方实体图谱中的所述第一实体与对应的各所述相似影视图谱中的影视实体之间的属性相似度,且比较所述属性相似度中的最大值是否大于预定阈值;融合模块,用于当所述计算比较模块比较出该最大值大于所述预定阈值时,则以该最大值所对应的相似影视图谱作为该电影资源方实体图谱对应的标定影视图谱,将该电影资源方实体图谱中的所述第二实体及其属性值融合至对应的所述标定影视图谱。在一些实施例中,该系统还包括:转换模块,用于在所述融合模块完成对全部所述电影资源方实体图谱的处理之后,针对所述影视剧知识图谱库中的每个所述标定影视图谱,在该所述标定影视图谱中,以城市为维度对各资源方分别在不同城市的所述售票信息进行分类,并建立以城市作为第三实体的节点,各资源方分别在不同城市的所述售票信息作为对应的所述第三实体的属性值。在一些实施例中,该系统还包括:接收模块,用于在所述转换模块完成对所述标定影视图谱的处理之后,接收查询请求,所述查询请求包括:待查电影名称以及待查城市;定位模块,本文档来自技高网...

【技术保护点】
1.一种多源售票数据管理方法,其特征在于,包括:获取多家资源方的多条原始电影售票数据;对所述原始电影售票数据进行结构化处理,以转变为具有预定结构的结构化电影售票数据,所述结构化电影售票数据包括:电影名称、至少一项电影关联信息、资源方信息以及资源方分别在不同城市的售票信息;针对每条所述结构化电影售票数据,以该结构化电影售票数据中的所述电影名称和所述资源方信息分别作为第一实体和第二实体,对该结构化电影售票数据进行实体化,生成对应的电影资源方实体图谱,其中,所述第二实体作为所述第一实体的附属实体,各项所述电影相关信息作为所述第一实体的属性值,各所述售票信息作为所述第二实体的属性值;针对每个所述电影资源方实体图谱,从预定的影视剧知识图谱库中确定出与该电影资源方实体图谱中的第一实体相关联的影视实体所对应的影视图谱,以作为相似影视图谱,并分别计算该电影资源方实体图谱中的所述第一实体与各所述相似影视图谱中的影视实体之间的属性相似度,且比较所述属性相似度中的最大值是否大于预定阈值,其中,当比较出该最大值大于所述预定阈值时,则以该最大值所对应的相似影视图谱作为该电影资源方实体图谱对应的标定影视图谱,将该电影资源方实体图谱中的所述第二实体及其属性值融合至对应的所述标定影视图谱。...

【技术特征摘要】
1.一种多源售票数据管理方法,其特征在于,包括:获取多家资源方的多条原始电影售票数据;对所述原始电影售票数据进行结构化处理,以转变为具有预定结构的结构化电影售票数据,所述结构化电影售票数据包括:电影名称、至少一项电影关联信息、资源方信息以及资源方分别在不同城市的售票信息;针对每条所述结构化电影售票数据,以该结构化电影售票数据中的所述电影名称和所述资源方信息分别作为第一实体和第二实体,对该结构化电影售票数据进行实体化,生成对应的电影资源方实体图谱,其中,所述第二实体作为所述第一实体的附属实体,各项所述电影相关信息作为所述第一实体的属性值,各所述售票信息作为所述第二实体的属性值;针对每个所述电影资源方实体图谱,从预定的影视剧知识图谱库中确定出与该电影资源方实体图谱中的第一实体相关联的影视实体所对应的影视图谱,以作为相似影视图谱,并分别计算该电影资源方实体图谱中的所述第一实体与各所述相似影视图谱中的影视实体之间的属性相似度,且比较所述属性相似度中的最大值是否大于预定阈值,其中,当比较出该最大值大于所述预定阈值时,则以该最大值所对应的相似影视图谱作为该电影资源方实体图谱对应的标定影视图谱,将该电影资源方实体图谱中的所述第二实体及其属性值融合至对应的所述标定影视图谱。2.根据权利要求1所述的方法,其特征在于,在完成对全部所述电影资源方实体图谱的处理之后,还包括:针对所述影视剧知识图谱库中的每个所述标定影视图谱,在该所述标定影视图谱中,以城市为维度对各资源方分别在不同城市的所述售票信息进行分类,并建立以城市作为第三实体的节点,各资源方分别在不同城市的所述售票信息作为对应的所述第三实体的属性值。3.根据权利要求1所述的方法,其特征在于,在完成对全部所述标定影视图谱的处理之后,还包括:接收查询请求,所述查询请求包括:待查电影名称以及待查城市;从所述影视剧知识图谱库中定位出影视实体所对应的电影名称为所述待查电影名称的影视图谱;从所定位到的所述影视图谱中定位出城市为所述待查城市的第三实体,并基于所定位到的第三实体,查询出该第三实体的全部属性以及属性值;将查询结果进行反馈。4.根据权利要求1所述的方法,其特征在于,在所述获取多家资源方的多条原始电影售票数据的步骤之后,且在所述对所述原始电影售票数据进行结构化处理的步骤之前,还包括:针对每条所述原始电影售票数据,对该原始电影售票数据进行数据有效性验证,其中,当该原始电影售票数据未通过验证时,则将该原始电影售票数据丢弃。5.根据权利要求4所述的方法,其特征在于,所述对该原始电影售票数据进行数据有效性验证的步骤具体包括:检测该原始电影售票数据中是否包含有所述电影名称、所述资源方信息、所述资源方在不同城市的售票信息以及预定电影关联信息;其中,当检测出该原始电影售票数据中包含有所述电影名称、所述资源方信息、所述资源方在不同城市的售票信息以及预定电影关联信息时,则该所述该原始电影售票数据通过有效性验证;当检测出该原始电影售票数据中缺少所述电影名称、所述资源方信息、所述资源方在不同城市的售票信息以及预定电影关联信息中的至少一者时,则该所述该原始电影售票数据未通过有效性验证。6.根据权利要求1所述的方法,其特征在于,所述从预定的影视剧知识图谱库中确定出与该电影资源方实体图谱中的第一实体相关联的影视实体所对应的影视图谱,以作为相似影视图谱的步骤具体包括:获取该电影资源方实体图谱中的第一实体所对应的电影名称以及该电影名称的别名,统称为电影可选名称;从所述影视剧知识图谱库中筛选出影视实体所对应的电影名称为所述电影可选名称的影视图谱,筛选出的影视图谱作为该电影资源方实体图谱对应的相似影视图谱。7.根据权利要求1所述的方法,其特征在于,基于如下式子计算所述电影资源方实体图谱中的所述第一实体与所述相似影视图谱中的影视实体之间的属性相似度:其中,Qa,b表示所述电影资源方实体图谱中的所述第一实体与所述相似影视图谱中的影视实体之间的属性相似度,n表示预定用于计算属性相似度的n个属性,ai表示所述电影资源方实体图谱中的所述第一实体所对应的预定用于计算属性相似度的n个属性中的第i个属性的属性值,bi表示所述相似影视图谱中的所述影视实体所对应的预定用于计算属性相似度的n个属性中的第i个属性的属性值,S(ai,bi)表示属性值ai与属性值bi之间的相似度,pi表示S(ai,bi)所对应的权值。8.根据权利要求7所述的方法,其特征在于,所述预定用于计算属性相似度的属性包括:上映年份、导演和演员表中的至少一者。9.根据权利要求1-8中任一所述的方法,其特征在于,所述获取多家资源方的多条原始电影售票数据的步骤具体包括:从多家资源方处抓取所述原始电影售票数据;和/或,接收多家资源方所推送的所述原始电影售票数据。10.一种多源售票数据管理系统,其特征在于,包括:获取模块,用于获取多家资源方的多条原始电影售票数据;处理模块,用于对所述原始电影售票数据进行结构化处理,以转变为具有预定结构的结构化电影售票数据...

【专利技术属性】
技术研发人员:王建华刘东学卢佳俊邝智杰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1