【技术实现步骤摘要】
用于挖掘搜索查询日志的数据仓库
本专利技术一般涉及计算机和计算机软件,尤其涉及用于分析与由旅行管理系统接收的搜索查询相关的大量数据的方法、装置和计算机程序产品。
技术介绍
旅游业在过去几十年中显著增长,这导致了旅行提供商的数量和这些提供商之间要管理的数据量的增加。随着提供商数量的增加,出现了提供旅行管理系统的中介机构。这些旅行管理系统管理旅行提供商和最终用户之间的通信,由此使得旅行社系统、航空公司预定系统和旅行网站的用户能够从大量的旅行提供商系统中检索信息。这些用户在搜索航班时常常提交低票价搜索(LFS,low-fare-search)查询。LFS查询通常定义起点、目的地以及期望在起点与目的地之间旅行时的一个或多个日期和/或时间。旅行管理系统通常通过确定起点与目的地之间的一个或多个航班的集合以及可以与每个航班一起使用的票价来响应这些LFS查询。票价可以由使用运价数据提供商(诸如航空公司运价发布公司(ATPCO)之类)发布的运价数据以计算票价的票价引擎确定。搜索结果通常包括旅行选项列表,所述旅行选项列表包括航班和票价信息。LFS查询常常被用来在规划行程的早期阶段识别潜在的航班。因此,用户通常在选择和预订(book)航班之前提交多个LFS查询。没有具体旅行计划的旅行者也可以提交查询,以便确定哪里是他们想要旅行的地方,还是仅仅出于好奇。因此,旅行管理系统接收到的LFS查询的数量可能会超过最终预订的空位数量很多倍。由于接收到大量的LFS查询,旅行系统可能难以管理LFS查询,并且通常在其已经做出应答之后丢弃LFS查询。因此,常规的旅行管理系统无法提供与已接收达一段时 ...
【技术保护点】
一种数据仓库系统,包括:一个或多个处理器;以及存储器,耦合到所述一个或多个处理器,所述存储器存储包括查询日志记录的第一数据库的第一数据以及当由所述一个或多个处理器执行时使所述系统执行以下操作的指令:接收多个搜索查询,每个搜索查询在接收时间被接收,并且定义出发时间和起点‑目的地对;以及对于每个搜索查询:确定从所述搜索查询的接收时间到出发时间的直到出发为止的时间,以及在与起点‑目的地对相关联的查询日志记录中存储指示搜索查询的接收和距出发的时间的第二数据,其中每个查询日志记录对于与所述查询日志记录相关联的起点‑目的地对,指示空位数量以及与每个空位相关联的距出发的时间。
【技术特征摘要】
2016.06.21 FR 1655746;2016.06.21 US 15/188,2281.一种数据仓库系统,包括:一个或多个处理器;以及存储器,耦合到所述一个或多个处理器,所述存储器存储包括查询日志记录的第一数据库的第一数据以及当由所述一个或多个处理器执行时使所述系统执行以下操作的指令:接收多个搜索查询,每个搜索查询在接收时间被接收,并且定义出发时间和起点-目的地对;以及对于每个搜索查询:确定从所述搜索查询的接收时间到出发时间的直到出发为止的时间,以及在与起点-目的地对相关联的查询日志记录中存储指示搜索查询的接收和距出发的时间的第二数据,其中每个查询日志记录对于与所述查询日志记录相关联的起点-目的地对,指示空位数量以及与每个空位相关联的距出发的时间。2.如权利要求1所述的系统,其中所述指令还使所述系统:定义包括多个字段的索引,每个字段对应于相应的起点-目的地对,每个字段定义与相应的起点-目的地对相关联的每个查询日志记录在第一数据库中的位置。3.如权利要求1或2所述的系统,其中所述搜索查询是低票价搜索查询。4.如权利要求1或2所述的系统,其中所述指令还使所述系统:接收为相应的起点-目的地对提供针对时间段的统计数据的请求;响应于接收到所述请求,从第一数据库检索一个或多个查询日志记录,所述一个或多个查询日志记录中的每一个查询日志记录与相应的起点-目的地对相关联,并且包括与定义落入所述时间段内的相应出发时间的搜索查询相关的数据;从检索出的查询日志记录中的每一个查询日志记录提取第二数据;基于第二数据生成第一拾取曲线,第一拾取曲线描绘在所述时间段期间相对于距出发的时间、针对相应的起点-目的地对的搜索查询的强度,其中所述系统跟踪并提供指示搜索查询的接收和距出发的时间的数据;以及使用第一拾取曲线针对相应的起点-目的地对预测对空位的需求,其中预测使用历史搜索查询数据而不是单独的历史预订数据来预计未来的需求。5.如权利要求4所述的系统,其中由所述一个或多个查询日志记录中的每一个查询日志记录定义的出发时间在接收到请求时已经过去。6.如权利要求4或5所述的系统,其中所述时间段覆盖多个出发区间,并且所述指令使所述系统使用第一拾取曲线通过以下操作来针对相应的起点-目的地对预测对空位的需求:向第二数据库查询第三数据,第三数据针对在所述时间段期间已经出发的相应的起点-目的地对定义对空位的多个预订;使用第三数据生成第二拾取曲线,第二拾取曲线描绘在所述时间段期间相对于距出发的时间的预订数量;以及生成作为第一拾取曲线和第二拾取曲线的加权平均的第三拾取曲线,其中使用第三拾取曲线针对相应的起点-目的地对预测对空位的需求。7.如权利要求6所述的系统,其中所述指令还使所述系统对于被所述时间段覆盖的至少一个出发区间:确定针对相应的起点-目的地对的第四拾取曲线;确定在第三拾取曲线和第四拾取曲线之间提供最佳拟合的权重因子;以及使用具有提供最佳拟合的权重的第三拾取曲线对于未来的出发区间针对相应的起点-目的地对预测对空位的需求,其中第四拾取曲线是目标拾取曲线。8.如权利要求7所述的系统,其中所述指令还使所述系...
【专利技术属性】
技术研发人员:B·拉都,R·A·阿库纳阿格斯特,
申请(专利权)人:艾玛迪斯简易股份公司,
类型:发明
国别省市:法国,FR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。