一种用于对网页进行评估的方法、装置和设备制造方法及图纸

技术编号:8215708 阅读:191 留言:0更新日期:2013-01-17 13:35
本发明专利技术的目的是提供一种基于迁移学习方法确定网页评估模型的方法、装置和设备。根据本发明专利技术的方法,包括:获取待建立网页评估模型的一组目标样本组以及与其对应的至少一组参照样本组;根据所述目标样本组以及所述至少一组参照样本组,获得所述至少一组参照样本组中部分或全部参照样本组相对于所述目标样本组的权重调整信息;根据所述目标样本组、各个参照样本组所对应的所述权重调整信息以及所述预定训练方式来执行迁移操作,获得所述目标样本组的网页评估模型。本发明专利技术的优点在于:能够快速达到收敛,建立起稳定的评估模型,因此能够很好的适用于海量数据的处理,对于当前海量的网页的评估可获得较好的效果。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种用于对网页进行评估的方法、装置和设备
技术介绍
随着互联网日渐融入人们的生活,互联网上的广告已经成为企业进行产品/服务营销的重要手段,而相应的,用户迫切需要了解广告投放的效果如何,以根据投放效果来相应的调整广告投放策略。然而,每次将所获得所有数据来建立模型,不仅效率较低,而且其模型的偏差和变异都较大。因此,建立起根据已知数据来评估将投放的广告信息的评估模型,亦即采用迁移方法建立评估模型是许多人的迫切需求。然而,由于互联网规模的快速膨胀,各类数据量急剧递增,广告信息也不例外,动辄即是海量数据。而现有的迁移算法需要通过对各个数据进行迭代操作来实现,在海量数 据的情况下,即使通过较长时间的学习训练操作,也很难达到一个稳定的收敛状态。故而,如何可以最优的利用已有数据、建立能在海量数据情况下快速达到收敛的模型,是当前亟待解决的问题。
技术实现思路
本专利技术的目的是提供一种基于迁移学习方法确定网页评估模型的方法、装置和设备。根据本专利技术的一个方面,提供一种用于对网页进行评估的方法,其中,所述网页包括多项特征相关信息,所述方法包括以下步骤a获取待建立网页评估模型的一组目标样本组以及与其对应的至少一组参照样本组,其中,所述目标样本组及其对应的至少一组参照样本组分别包括多个网页;b根据所述目标样本组以及所述至少一组参照样本组,获得所述至少一组参照样本组中部分或全部参照样本组相对于所述目标样本组的权重调整信息;c根据所述目标样本组、各个参照样本组所对应的所述权重调整信息以及所述预定训练方式来执行迁移操作,获得所述目标样本组的网页评估模型;d基于所述网页评估模型对一个或多个待评估网页进行评估。根据本专利技术的另一个方面,还提供了一种用于对网页进行评估的网页评估装置,其中,所述网页包括多项特征相关信息,所述网页评估装置包括第一获取装置,用于获取待建立网页评估模型的一组目标样本组以及与其对应的至少一组参照样本组,其中,所述目标样本组及其对应的至少一组参照样本组分别包括多个网页;权重获取装置,用于根据所述目标样本组以及所述至少一组参照样本组,获得所述至少一组参照样本组中部分或全部参照样本组相对于所述目标样本组的权重调整信息;模型获取装置,用于根据所述目标样本组、各个参照样本组所对应的所述权重调整信息以及所述预定训练方式来执行迁移操作,获得所述目标样本组的网页评估模型;评估装置,用于基于所述网页评估模型对一个或多个待评估网页进行评估。根据本专利技术的另一个方面,还提供了一种计算机设备,其中,该计算机设备包括所述网页评估装置。与现有技术相比,本专利技术具有以下优点I)根据本实施例的迁移操作需要对每个数据进行迭代操作,故而能够快速达到收敛,建立起稳定的评估模型,因此能够很好的适用于海量数据的处理,对于当前海量的网页的评估可获得较好的效果。2)通过执行数据迁移或者模型迁移操作,可基于当前已有的数据或模型,来建立与目标样本组对应的、合理的评估模型,以对属于目标样本组的各个网页进行评估;并可较 好的适用于海量数据的处理。3)使用者可进一步根据网页信息的评估结果来确定其应用场景。例如,当所评估的网页信息包括线上广告时,即可对广告的投放效果来进行评估过,并根据评估所得的广告效果来调整广告信息的投放情况,例如,调整广告的投放时间段,以提高其点击率;又例如,调整广告的目标用户,以提高广告与用户的匹配度等,从而提高了广告投放的效率以及广告的转化率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显图I为根据本专利技术的一个方面的一种计算机实现的用于对网页进行评估的方法流程图;图2为根据本专利技术一个优选实施例的一种用于对网页进行评估的方法流程图;图3为根据本专利技术的又一个优选实施例的一种用于对网页进行评估的方法流程图;图4为根据本专利技术的再一个优选实施例的一种用于对网页进行评估的方法流程图;图5为根据本专利技术的一个方面的一种用于对网页进行评估的网页评估装置的结构示意图;图6为根据本专利技术的一个优选实施例的一种用于对网页进行评估的网页评估装置的结构示意图;图7为根据本专利技术的又一个优选实施例的一种用于对网页进行评估的网页评估装置的结构示意图;图8为根据本专利技术的再一个优选实施例的一种用于对网页进行评估的网页评估装置的结构示意图;附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本专利技术作进一步详细描述。图I示意出了根据本专利技术的一个方面的一种计算机实现的用于对网页进行评估的方法流程图。根据本专利技术的方法包括步骤SI、步骤S2、步骤S3以及步骤S4。其中,根据本专利技术的方法通过计算机设备实现。所述计算机设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述计算机设备包括网络设备和/或用户设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、PDA、游戏机、或IPTV等。其中,所述用户设备及网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。 需要说明的是,所述用户设备、网络设备以及网络仅为举例,其他现有的或今后可能出现的用户设备、网络设备以及网络如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。根据本专利技术的方法用于获取网页评估模型,并用所述网页评估模型对网页进行评估。其中,本专利技术中所述的模型包括基于机器学习方式建立的模型。所述机器学习是一类基于概率论、统计学、逼近论、凸分析、算法复杂度理论,从数据中自动分析获得规律,并利用规律对未知数据进行预测的方法。基于所述机器学习方式建立的模型可通过对大量数据的训练来发现其中的规律,并基于该规律运行以对未知数据进行预测。并且,所述模型能通过基于以往数据的训练来优化自身对于未知数据的预测性能。其中,所述网页包括多项特征相关信息。所述特征相关信息包括与网页相关的各类信息,优选地,所述特征相关信息包括可能影响用于对于网页所发布的信息的接收程度的各项信息。优选地,所述网页包括用于向用户发布产品或服务信息的广告信息,相应地,所述广告信息的特征相关信息包括可能影响该广告信息的广告效果的各项信息。所述网页评估模型包括用于评估广告的广告评估模型。更优选地,所述广告信息可嵌入于其他网页中。例如,以悬浮窗口的形式嵌入于新闻网页中的广告信息;又例如,以图片、音视频等形式嵌入于网页中的广告信息,再例如,以文本、链接等形式展现在网页中的广告信息等。其中,根据本专利技术所述的多个网页及其特征相关信息可预存储于用于执行本专利技术的方法的计算机设备中,或者,由执行本专利技术的计算机设备由其所连接的其他设备中获取。优选地,所述计算机设备可从发布网页的一本文档来自技高网...

【技术保护点】
一种计算机实现的用于对网页进行评估的方法,其中,所述网页包括多项特征相关信息,所述方法包括以下步骤:a?获取待建立网页评估模型的一组目标样本组以及与其对应的至少一组参照样本组,其中,所述目标样本组及其对应的至少一组参照样本组分别包括多个网页;b?根据所述目标样本组以及所述至少一组参照样本组,获得所述至少一组参照样本组中部分或全部参照样本组相对于所述目标样本组的权重调整信息;c?根据所述目标样本组、各个参照样本组所对应的所述权重调整信息以及所述预定训练方式来执行迁移操作,获得所述目标样本组的网页评估模型;d?基于所述网页评估模型对一个或多个待评估网页进行评估。

【技术特征摘要】

【专利技术属性】
技术研发人员:武鹏程戴文渊夏威
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1