数据的校准方法和装置制造方法及图纸

技术编号:27937688 阅读:39 留言:0更新日期:2021-04-02 14:18
本申请公开了数据的校准方法和装置,涉及数据校准和深度学习技术领域。具体实施方式包括:在包括至少两个级别的数据范围的样本数据的集合中,获取在最后的历史滑动时间窗口内且在初级数据范围内的样本数据;确定所获取的样本数据的用户转化数值和预设转化阈值的大小关系;基于比较结果,将初级数据范围或级别高于初级数据范围的数据范围,确定为目标数据范围;获取深度神经网络对目标数据范围内的样本数据的转化率的预测结果,确定预测结果对应的偏差评价数值;基于偏差评价数值,对深度神经网络的新的预测结果进行校准,得到校准结果。本申请可以通过对用户转化数值的比较结果,确定出合理的数值范围,从而提高对深度神经网络的预测结果的校准准确度。

【技术实现步骤摘要】
数据的校准方法和装置
本申请涉及计算机
,具体涉及人工智能
,进一步涉及数据校准和深度学习
,尤其涉及数据的校准方法和装置。
技术介绍
深度学习是机器学习领域的一个研究方向,它被引入机器学习使其更接近于最初的人工智能目标。随着深度学习技术的发展,越来越多的场景都开始应用到深度学习技术,比如信息推广场景、搜索场景等等。深度学习往往通过深度学习模型来实现。深度学习模型存在输入和输出。深度学习模型对输入的内容来进行预测,输出的内容即是预测的结果。
技术实现思路
提供了一种数据的校准方法、装置、电子设备以及存储介质。根据第一方面,提供了一种数据的校准方法,包括:在包括至少两个级别的数据范围的样本数据的集合中,获取在最后的历史滑动时间窗口内且在初级数据范围内的样本数据,其中,所述样本数据为推广信息相关数据,一个级别的数据范围内的样本数据包括且多于低于该级别的任一级别的数据范围内的样本数据;确定所获取的样本数据的用户转化数值,比较该用户转化数值和预设转化阈值的大小关系,得到比较结果;基于所述比较结果,将所述初级数据范围或级别高于所述初级数据范围的数据范围,确定为目标数据范围;获取深度神经网络对所述目标数据范围内的样本数据的转化率的预测结果,确定所述预测结果对应的偏差评价数值;基于所述偏差评价数值,对所述深度神经网络的新的预测结果进行校准,得到校准结果,其中,所述新的预测结果对应新的样本数据。根据第二方面,提供了一种数据的校准装置,包括:获取单元,被配置成在包括至少两个级别的数据范围的样本数据的集合中,获取在最后的历史滑动时间窗口内且在初级数据范围内的样本数据,其中,所述样本数据为推广信息相关数据,一个级别的数据范围内的样本数据包括且多于低于该级别的任一级别的数据范围内的样本数据;确定单元,被配置成确定所获取的样本数据的用户转化数值,比较该用户转化数值和预设转化阈值的大小关系,得到比较结果;目标确定单元,被配置成基于所述比较结果,将所述初级数据范围或级别高于所述初级数据范围的数据范围,确定为目标数据范围;偏差确定单元,被配置成获取深度神经网络对所述目标数据范围内的样本数据的转化率的预测结果,确定所述预测结果对应的偏差评价数值;校准单元,被配置成基于所述偏差评价数值,对所述深度神经网络的新的预测结果进行校准,得到校准结果,其中,所述新的预测结果对应新的样本数据。根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行数据的校准方法中任一实施例的方法。根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使所述计算机执行根据数据的校准方法中任一实施例的方法。根据第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据数据的校准方法中任一实施例的方法。根据本申请的方案,可以通过比较转化结果,确定出合理的数值范围,从而提高对深度神经网络的预测结果的校准准确度。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请一些实施例可以应用于其中的示例性系统架构图;图2是根据本申请的数据的校准方法的一个实施例的流程图;图3是根据本申请的数据的校准方法的一个应用场景的示意图;图4是根据本申请的数据的校准方法的又一个实施例的流程图;图5是根据本申请的数据的校准装置的一个实施例的结构示意图;图6是用来实现本申请实施例的数据的校准方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的数据的校准方法或数据的校准装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。这里的终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对样本数据的集合等数据进行分析等处理,并将处理结果(例如校准结果)反馈给终端设备。需要说明的是,本申请实施例所提供的数据的校准方法可以由服务器105或者终端设备101、102、103执行,相应地,数据的校准装置可以设置于服务器105或者终端设备101、102、103中。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。继续参考图2,示出了根据本申请的数据的校准方法的一个实施例的流程200。该数据的校准方法,包括以下步骤:步骤201,在包括至少两个级别的数据范围的样本数据的集合中,获取在最后的历史滑动时间窗口内且在初级数据范围内的样本数据,其中,所述样本数据为推广信息相关数据,一个级别的数据范围内的样本数据包括且多于低于该级别的任一级别的数据范围内的样本数据。在本实施例中,数据的校准方法运行于其上的执行主体(例如图1所示的服务器或终端设备)可以在包括至少两个级别的数据范围的样本数据的集合中,获取样本数据。该样本数据在最后的历史滑动时间窗口内的数据,且该样本数据在初级数据范围内。历史滑动时间窗口可以指最近的历史时长内,比如刚刚过去的24小时内。在集合中的样本数据可以存在多个级别的数据范围。对于任意两个级别的数据范围,本文档来自技高网...

【技术保护点】
1.一种数据的校准方法,所述方法包括:/n在包括至少两个级别的数据范围的样本数据的集合中,获取在最后的历史滑动时间窗口内且在初级数据范围内的样本数据,其中,所述样本数据为推广信息相关数据,一个级别的数据范围内的样本数据包括且多于低于该级别的任一级别的数据范围内的样本数据;/n确定所获取的样本数据的用户转化数值,比较该用户转化数值和预设转化阈值的大小关系,得到比较结果;/n基于所述比较结果,将所述初级数据范围或级别高于所述初级数据范围的数据范围,确定为目标数据范围;/n获取深度神经网络对所述目标数据范围内的样本数据的转化率的预测结果,确定所述预测结果对应的偏差评价数值;/n基于所述偏差评价数值,对所述深度神经网络的新的预测结果进行校准,得到校准结果,其中,所述新的预测结果对应新的样本数据。/n

【技术特征摘要】
1.一种数据的校准方法,所述方法包括:
在包括至少两个级别的数据范围的样本数据的集合中,获取在最后的历史滑动时间窗口内且在初级数据范围内的样本数据,其中,所述样本数据为推广信息相关数据,一个级别的数据范围内的样本数据包括且多于低于该级别的任一级别的数据范围内的样本数据;
确定所获取的样本数据的用户转化数值,比较该用户转化数值和预设转化阈值的大小关系,得到比较结果;
基于所述比较结果,将所述初级数据范围或级别高于所述初级数据范围的数据范围,确定为目标数据范围;
获取深度神经网络对所述目标数据范围内的样本数据的转化率的预测结果,确定所述预测结果对应的偏差评价数值;
基于所述偏差评价数值,对所述深度神经网络的新的预测结果进行校准,得到校准结果,其中,所述新的预测结果对应新的样本数据。


2.根据权利要求1所述的方法,其中,所述基于所述比较结果,将所述初级数据范围或级别高于所述初级数据范围的数据范围,确定为目标数据范围,包括:
若本次的比较结果是用户转化数值小于所述预设转化阈值,则确定所述集合中,级别仅高于本次的比较结果所对应级别的数据范围;
确定该数据范围内的样本数据的用户转化数值,比较该用户转化数值和预设转化阈值的大小关系,得到新的比较结果;若该新的比较结果是用户转化数值不小于所述预设转化阈值,则确定该数据范围为目标数据范围。


3.根据权利要求1所述的方法,其中,每个级别的数据范围存在相对应的数据限制条件,对于任意两个级别的数据范围,较高级别的数据范围的数据限制条件包括且多于较低级别的数据范围的数据限制条件;
所述确定所述集合中,级别仅高于本次的比较结果所对应级别的数据范围,包括:
对于所述多个数据限制条件,减少指定的至少一个数据限制条件,其中,所述指定的至少一个数据限制条件指示本次的比较结果所对应级别的数据范围与级别仅高于该数据范围的数据范围之间的数据范围之差;
将减少后的数量限制条件指示的数据范围,作为级别仅高于本次的比较结果所对应级别的数据范围。


4.根据权利要求1所述的方法,其中,所述基于所述比较结果,将所述初级数据范围或级别高于所述初级数据范围的数据范围,确定...

【专利技术属性】
技术研发人员:王佳李东方
申请(专利权)人:上海连尚网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1