用于预测在线用户交互的机器学习方法和系统技术方案

技术编号:24019972 阅读:29 留言:0更新日期:2020-05-02 04:55
一种计算机实现的方法,包括访问在线数据存储库以检索与内容投放事件相关的记录以及与用户交互事件相关的记录。从原始特征值计算丰富训练特征向量集合,并将其与交互事件标签一起使用以训练机器学习模型。处理器被配置为执行机器学习模型,并且接收与在线内容投放位相关的信息和与用户相关的信息。处理器基于所选择的用于在在线内容投放位内投放的内容项、与用户相关的信息以及与在线内容投放位相关的信息,计算丰富估计特征向量。处理器基于丰富估计特征向量执行机器学习模型,以确定用户与所选择的内容项交互的可能性的估计。

Machine learning methods and systems for predicting online user interaction

【技术实现步骤摘要】
【国外来华专利技术】用于预测在线用户交互的机器学习方法和系统
本专利技术涉及机器学习模型在预测在线用户的行为方面的应用。特别地,本专利技术的实施例基于先前用户在相似上下文中的聚合行为来预测用户与在线内容元素的交互的可能性。本专利技术可以应用于在线广告系统中,例如以确定是否对要例如经由移动应用内的网页呈现给用户的广告的投放进行竞价。
技术介绍
在线(例如,基于web、移动或应用内)广告与传统媒体中的广告不同之处在于其个性化受众定向的程度。例如,广播媒体广告(诸如电视广告之类)旨在到达由广泛特性(诸如年龄组、社会经济状态和/或一般兴趣之类)所定义的目标人群,而在线广告旨在到达对所呈现的产品、服务或信息具有特定兴趣的个人。高度个性化受众定向技术已使得特定于在线广告的商业模型的发展。例如,现在对于提供新闻、聚合信息和特定用户感兴趣的其他内容的网站来说,托管第三方广告作为产生收入的手段已经很常见。这些网站上出现的广告的广告主可以基于观看机会或印象(通常如以“每千次印象(impression)成本”(又名CPM)来计量)、基于每次点击成本(CPC)或根据某种其它性能计量来向运营商付款。投放在要呈现给个人用户的网页上的广告的实际选择至少可以部分地基于竞价处理,由此愿意支付更高CPM、CPC或其它费用计量的广告主更可能将其广告呈现给用户。根据一种常见的模型,“广告交易(exchange)平台”促进了竞价处理。广告交易所是这样的技术平台,其实现允许广告主和网站以及其它在线内容的发布者通常通过实时拍卖来买卖广告空间的数字市场。著名的广告交易平台包括DoubleClickTM(由GoogleTM拥有)、AppNexusTM、MicrosoftTMAdExchangeTM和OpenXTM。广告交易所维护“广告位”池。发布者将其广告位(例如,嵌入在用于用户的网页内的可用广告位)贡献到池中。然后,买家可以对他们想要购买的广告位竞价。竞价决策通常基于诸如广告所用于的用户的先前行为、一天中的时间、设备类型、广告位置等信息实时做出。在实践中,这些竞价决策本身必须非常迅速地做出,例如,使用通常称为需求方平台(DSP)的技术平台在最多几十毫秒内做出。由于广告主通过广告交易购买印象会产生实际成本,因此DSP中部署的用于评估用户的潜在“价值”以便做出竞价决策的技术和算法的性能可能具有重大的业务影响。举例来说,基于web的显示广告的平均点击率(CTR)约为0.05%,即每10,000次印象有5次点击。在经由广告交易购买广告位的情况下,每次印象都表示成本(即,获胜竞价后支付的价格)。但是,在采用CPC模型的情况下,平均只有0.05%的印象会导致产生收入。因此,较低的CTR会导致技术资源(诸如DSP的处理资源之类)的低效使用以及对于成功广告主的更高成本(由于较少的“点击”次数必须覆盖所有印象的成本)。此外,较低的CTR指示向在线用户显示的广告缺乏适当性或相关性。因此,非常期望在DSP平台中部署能够导致更高CTR的技术。通过增强技术资源的利用率和增加用户与广告内容的交互产生的收入,此类技术可以使DSP运营商受益。广告主也可以从更有效和更成功的广告投放中受益,从而获得更高的点击率,并送达更多潜在感兴趣的顾客的受众。在线用户也从中受益,因为更高的CTR一般是由具有对用户的更大适当性和相关性的广告投放来实现的。提高CTR的一种常见方法是采用在线跟踪来推断用户兴趣并投放与那些兴趣相关的广告内容。例如,浏览器cookie和其它跟踪技术可以用于收集关于例如用户访问的网站、在社交媒体网站上查看的主题和/或用户进行的在线搜索的信息。可以处理这样的信息以识别被推断为与用户相关的广告内容。但是,预测用户将与此类内容进行交互的可能性更为困难。如上所述,平均CTR很低,因此即使广告内容已基于用户兴趣进行有效定位,单个在线用户也很少与广告内容进行交互。相应地,很少有直接数据可以用于基于单个用户跟踪来预测用户与广告内容进行交互的可能性。因此,显然需要实时计算机实现的技术、方法和系统,这些技术、方法和系统可以被部署在DSP内,并且能够通过广告交易平台做出关于广告选择和竞价的改进决策。特别地,期望提供用于预测在线用户将与广告内容交互的可能性的改进的方法和系统。为了满足技术要求,并确保在选择和竞价处理中不会过分增加页面加载时间,有必要在不超过几十毫秒的时间内做出这样的预测。本专利技术致力于解决这些需求。
技术实现思路
一方面,本专利技术提供了一种计算机实现的方法,包括:访问在线数据存储库以检索与内容投放事件相关的记录以及与用户交互事件相关的记录,其中投放事件和交互事件在定义的时间段内发生;将检索到的内容投放事件记录与检索到的交互事件记录进行匹配,以生成包括多条记录的匹配数据集合,该匹配数据集合的每条记录都包括从内容投放事件中导出的原始特征值集合以及指示是否发生了与内容投放事件对应的交互事件的交互事件标签;从原始特征值计算丰富训练特征向量的对应集合;使用丰富训练特征向量和对应的交互事件标签来训练机器学习模型;在被配置为执行机器学习模型的处理器处,接收与在线内容投放位相关的信息和与将向其显示在线内容投放位内的内容的用户相关的信息;由该处理器基于所选择的用于在在线内容投放位内投放的内容项、与用户相关的信息以及与在线内容投放位相关的信息,计算丰富估计特征向量;由执行机器学习模型的该处理器基于丰富估计特征向量,确定用户与所选择的内容项交互的可能性的估计。有利的是,本专利技术的实施例采用聚合的内容投放事件与聚合的用户交互事件的匹配,以支持使用机器学习模型预测在线用户与内容的交互。内容项可以例如是包括一个或多个供应物(offer)的在线广告,并且用户交互事件可以包括诸如对广告内的特定供应物的点击之类的交互。相应地,在这样的实施例中:在线内容投放位是广告位;接收与广告位相关的信息和与将向其显示广告位内的内容的用户相关的信息以及从广告交易服务器发送的竞价请求消息;以及内容项包括用于投放在广告位内的至少一个供应物。该方法还可以包括:作为对竞价请求消息的回复,由处理器向广告交易服务器发送竞价响应消息;由处理器从广告交易服务器接收成功竞价通知;由处理器用与内容项的投放相关的内容投放事件数据更新在线数据存储库;由处理器接收用户与内容项交互的通知;以及用与内容项的用户交互相关的用户交互事件数据更新(226)在线数据存储库(166)。以这种方式,本专利技术的实施例提供了对内容投放事件和用户交互事件的存储记录的连续更新,从而使得机器学习模型能够用关于用户行为的当前信息更新。为此,该方法可以包括重复执行以下步骤:访问在线数据存储库、将检索到的内容投放事件记录与检索到的交互事件记录进行匹配、计算丰富训练特征向量以及训练机器学习模型。在另一方面,本专利技术提供了一种实现需求方平台的计算装置,该计算装置包括:处理器;处理器可访问的至少一个存储器设备;以及与处理器可操作地相关本文档来自技高网
...

【技术保护点】
1.一种实现需求方平台的计算装置,所述计算装置包括:/n处理器;/n所述处理器可访问的至少一个存储器设备;以及/n与所述处理器可操作地相关联的数据通信接口,/n其中所述存储器设备包含程序指令主体,所述程序指令主体包括机器学习模型,所述机器学习模型可由所述处理器执行并且被配置为确定用户与内容项交互的可能性的估计,所述模型已使用丰富训练特征向量集合以及从匹配数据集合导出的对应的交互事件标签进行训练,所述匹配数据集合是从与内容投放事件相关的记录和与从在线数据存储库中检索到的用户交互事件相关的记录生成的,其中所述投放事件和所述交互事件在定义的时间段内发生,/n所述程序指令主体还包括指令,所述指令在由所述处理器执行时使所述计算装置实现包括以下步骤的方法:/n经由所述数据通信接口接收与在线内容投放位相关的信息和与将向其显示所述在线内容投放位内的内容的用户相关的信息;/n基于所选择的用于投放在所述在线内容投放位内的内容项、与所述用户相关的信息以及与对应的在线内容投放位相关的信息,计算丰富估计特征向量;以及/n执行所述机器学习模型以基于所述丰富估计特征向量确定所述用户与所选择的内容项交互的可能性的估计。/n...

【技术特征摘要】
【国外来华专利技术】20170914 FR 1758514;20170914 US 15/704,3201.一种实现需求方平台的计算装置,所述计算装置包括:
处理器;
所述处理器可访问的至少一个存储器设备;以及
与所述处理器可操作地相关联的数据通信接口,
其中所述存储器设备包含程序指令主体,所述程序指令主体包括机器学习模型,所述机器学习模型可由所述处理器执行并且被配置为确定用户与内容项交互的可能性的估计,所述模型已使用丰富训练特征向量集合以及从匹配数据集合导出的对应的交互事件标签进行训练,所述匹配数据集合是从与内容投放事件相关的记录和与从在线数据存储库中检索到的用户交互事件相关的记录生成的,其中所述投放事件和所述交互事件在定义的时间段内发生,
所述程序指令主体还包括指令,所述指令在由所述处理器执行时使所述计算装置实现包括以下步骤的方法:
经由所述数据通信接口接收与在线内容投放位相关的信息和与将向其显示所述在线内容投放位内的内容的用户相关的信息;
基于所选择的用于投放在所述在线内容投放位内的内容项、与所述用户相关的信息以及与对应的在线内容投放位相关的信息,计算丰富估计特征向量;以及
执行所述机器学习模型以基于所述丰富估计特征向量确定所述用户与所选择的内容项交互的可能性的估计。


2.根据权利要求1所述的装置,其中所述机器学习模型是包括多个模型系数的广义线性模型。


3.根据权利要求2所述的装置,其中所述机器学习模型是逻辑回归模型。


4.根据权利要求2或3所述的装置,其中所述多个模型系数被存储在字典数据结构中,在所述字典数据结构中每个条目由键和系数值定义,其中每个键包括特征名称和对应的特征值的拼接的散列表示,并且其中所述程序指令通过以下方式使所述计算装置实现执行所述机器学习模型的步骤:
为所述丰富估计特征向量的每个特征值生成对应的键;
从所述字典数据结构中为每个生成的键检索对应的系数值;以及
使用所述丰富估计特征向量和检索到的系数值计算所述用户与所选择的内容项交互的可能性的估计。


5.根据权利要求1至4中的任一项所述的装置,其中:
所述在线内容投放位是广告位;
接收与所述广告位相关的信息和与将向其显示所述广告位内的内容的所述用户相关的信息以及从广告交易服务器发送的竞价请求消息;
所述内容项包括用于投放在所述广告位内的至少一个供应物,以及
所述程序指令主体还包括在由所述处理器执行时使所述计算装置实现还包括以下步骤的方法的指令:
作为对所述竞价请求消息的回复,向所述广告交易服务器发送竞价响应消息;
响应于从所述广告交易服务器接收到成功竞价通知,用与所述内容项的投放相关的内容投放事件数据更新在线数据存储库;以及
响应于接收到用户与所述内容项交互的通知,用与所述内容项的用户交互相关的用户交互事件数据更新所述在线数据存储库。


6.根据权利要求1至5中的任一项所述的装置,其中与内容投放事件相关的记录和与用户交互事件相关的记录不包括彼此之间明确的链接。


7.一种实现机器学习模型的训练的计算装置,所述机器学习模型被配置为估计用户与内容项交互的可能性,所述计算装置包括:
处理器;
所述处理器可访问的至少一个存储器设备;以及
所述处理器可访问的数据存储库,
其中所述存储器设备包含程序指令主体,所述程序指令主体包括指令,所述指令在由所述处理器执行时使所述计算装置实现包括以下步骤的方法:
访问所述数据存储库以检索与内容投放事件相关的记录以及与用户交互事件相关的记录,其中所述投放事件和所述交互事件在定义的时间段内发生;
将检索到的内容投放事件记录与检索到的交互事件记录进行匹配,以生成包括多条记录的匹配数据集合,所述匹配数据集合的每条记录都包括从内容投放事件中导出的原始特征值集合以及指示是否发生了与内容投放事件对应的交互事件的交互事件标签;
从所述原始特征值计算丰富训练特征向量的对应集合;以及

【专利技术属性】
技术研发人员:R·爱邱纳·阿戈斯特A·R·芒提尼·道里维拉D·雷诺帝
申请(专利权)人:艾玛迪斯简易股份公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1