数据筛选策略生成方法和装置制造方法及图纸

技术编号:12128056 阅读:76 留言:0更新日期:2015-09-25 16:59
本发明专利技术公开了一种数据筛选策略生成方法,所述数据筛选策略生成方法包括以下步骤:获取各个样本数据的对应的第一筛选结果,以及各个所述样本数据对应筛选参数的第二筛选结果;基于所述第一筛选结果以及所述第二筛选结果计算各个筛选参数的筛选优先级;基于所述筛选优先级生成数据筛选策略。本发明专利技术还公开了一种数据筛选策略生成装置。本发明专利技术基于所述筛选优先级生成数据筛选策略,终端在进行数据筛选时,直接基于各个筛选参数的筛选优先级进行筛选,在有筛选参数不匹配时,即判定数据不匹配,筛选过程非常简便。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种数据筛选策略生成方法和装置
技术介绍
随着互联网的飞速发展,用户往往在互联网中可以查看到大量的数据,但在进行 数据查看时数据往往排列混乱,很难查找到需要的数据。例如,用户在查找图片时,数据库 中的图片参差不齐,系统在显示用户感兴趣的专题的时候,会出现很多与专题不符合的图 片或者是质量较差的图片。为解决上述问题,现有技术中往往通过设置筛选参数对数据进 行筛选,但筛选参数为多个时,往往需要同时计算各个筛选参数的匹配度,以确定符合的数 据,筛选过程非常复杂。
技术实现思路
本专利技术的主要目的在于提出一种数据筛选策略生成方法和装置,旨在解决移动数 据筛选过程复杂的技术问题。 为实现上述目的,本专利技术提供一种数据筛选策略生成方法,所述数据筛选策略生 成方法包括以下步骤: 获取各个样本数据的对应的第一筛选结果,以及各个所述样本数据对应筛选参数 的第二筛选结果; 基于所述第一筛选结果以及所述第二筛选结果计算各个筛选参数的筛选优先 级; 基于所述筛选优先级生成数据筛选策略。 优选地,所述基于所述第一筛选结果以及所述第二筛选结果计算各个筛选参数的 筛选优先级的步骤包括: 基于所述第一筛选结果相同的样本数据的数量计算标准样本值; 基于所述第二筛选结果相同的样本数据的数量计算各个筛选参数对应的信息 熵; 基于各个所述筛选参数的信息熵以及所述标准样本值计算各个所述筛选参数对 应的信息增益值; 基于所述信息增益值生成各个所述筛选参数的筛选优先级。其中所述增机值越大 所述筛选优先级越大。 优选地,所述基于所述第一筛选结果相同的样本数据的数量计算标准样本值的公 式如下: K(P1,P2,......,Pn) =-Pllog2(Pl)-P21og2(P2)-......-Pn log2(Pn); 其中,Pn为各个样本数据中第一筛选结果相同的样本数据的个数与所述样本数据 总个数的比值。 优选地,所述基于所述第一筛选结果相同的样本数据的数量计算标准样本值的步 骤包括: 依次提取每个筛选参数对应的第二筛选结果; 在每次提取到每个筛选参数对应的第二筛选结果时,获取第一筛选结果相同的样 本数据的数量作为第一计算值; 获取第一筛选结果相同的样本数据中第二筛选结果相同的样本数据的数量作为 第二计算值; 基于所述第一计算值和第二计算值计算提取的所述筛选参数对应的信息熵; 继续提取下一筛选参数对应的第二筛选结果,直至提取完所有样本数据的筛选结 果。 优选地,所述第三基于所述第一计算值和第二计算值计算提取的所述筛选参数对 应的信息熵的计算公式如下: W=H1K(P1,P2,......,Pn)+H2K(Pl,P2,......,Pn)+......+HnK(Pl,P2,......,Pn); 其中,所述Hn为所述第一计算值与样本数据总数之间的比值,Pn为第二计算值与 第一计算值之间的比值。 此外,为实现上述目的,本专利技术还提出一种数据筛选策略生成装置,所述数据筛选 策略生成装置包括: 获取模块,用于获取各个样本数据的对应的第一筛选结果,以及各个所述样本数 据对应筛选参数的第二筛选结果; 计算模块,用于基于所述第一筛选结果以及所述第二筛选结果计算个筛选参数的 筛选优先级; 生成模块,用于基于所述筛选优先级生成数据筛选策略。 优选地,所述计算模块包括: 计算子模块,用于基于所述第一筛选结果相同的样本数据的数量计算标准样本 值;基于所述第二筛选结果相同的样本数据的数量计算各个筛选参数对应的信息熵,以及 基于各个所述筛选参数的信息熵以及所述标准样本值计算各个所述筛选参数对应的信息 增益值; 生成子模块,用于基于所述信息增益值生成各个所述筛选参数的筛选优先级。其 中所述增机值越大所述筛选优先级越大。 优选地,所述计算子模块计算标准样本值的公式如下: K(P1,P2,......,Pn) =-Pllog2(Pl)-P21og2(P2)_......-Pn log2(Pn); 其中,Pn为各个样本数据中第一筛选结果相同的样本数据的个数与所述样本数据 总个数的比值。 优选地,所述计算子模块包括: 提取单元,用于依次提取每个筛选参数对应的第二筛选结果; 获取单元,用于在每次提取到每个筛选参数对应的第二筛选结果时,获取第一筛 选结果相同的样本数据的数量作为第一计算值,以及获取第一筛选结果相同的样本数据中 第二筛选结果相同的样本数据的数量作为第二计算值; 计算单元,用于基于所述第一计算值和第二计算值计算提取的所述筛选参数对应 的信息熵; 所述提取单元,还用于在所述计算单元计算出所述信息熵后,继续提取下一筛选 参数对应的第二筛选结果,直至提取完所有样本数据的筛选结果。 优选地,所述计算单元计算信息商的计算公式如下: W=H1K(P1,P2,......,Pn)+H2K(Pl,P2,......,Pn)+......+HnK(Pl,P2,......,Pn); 其中,所述Hn为所述第一计算值与样本数据总数之间的比值,Pn为第二计算值与 第一计算值之间的比值。 本专利技术提出的数据筛选策略生成方法和装置,获取各个样本数据的对应的第一筛 选结果,以及各个所述样本数据对应筛选参数的第二筛选结果,并基于所述第一筛选结果 以及所述第二筛选结果计算各个筛选参数的筛选优先级,基于所述筛选优先级生成数据筛 选策略,终端在进行数据筛选时,直接基于各个筛选参数的筛选优先级进行筛选,在有筛选 参数不匹配时,即判定数据不匹配,筛选过程非常简便。【附图说明】 图1示出了本专利技术实施例数据筛选策略生成装置所涉及的硬件架构; 图2为本专利技术数据筛选策略生成方法较佳实施例的流程示意图; 图3为本专利技术基于所述第一筛选结果以及所述第二筛选结果计算各个筛选参数 的筛选优先级的步骤的细化流程示意图; 图4为树形结构数据筛选策略的示意图; 图5为本专利技术数据筛选策略生成装置较佳实施例的功能模块示意图; 图6为本专利技术数据筛选策略生成装置较佳实施例中计算模块的细化流程示意图。 本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。【具体实施方式】 应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。 图1示出了本专利技术实施例数据筛选策略生成装置所涉及的硬件架构。如图1所示, 所述数据筛选策略生成装置所涉及的硬件包括:处理器1001,例如CPU,网络接口 1004,用 户接口 1003,存储器1005,通信总线1002。其中,通信总线1002用于实现该数据筛选策略 生成装置中各组成部件之间的连接通信。用户接口 1003可以包括显示屏(Display)、键盘 (Keyboard)、鼠标等组件,用于接收用户输入的信息,并将接收的信息发送至处理器1005 进行处理。显示屏可以为IXD显示当前第1页1 2 3 4 本文档来自技高网...
数据筛选策略生成方法和装置

【技术保护点】
一种数据筛选策略生成方法,其特征在于,所述数据筛选策略生成方法包括以下步骤:获取各个样本数据的对应的第一筛选结果,以及各个所述样本数据对应筛选参数的第二筛选结果;基于所述第一筛选结果以及所述第二筛选结果计算各个筛选参数的筛选优先级;基于所述筛选优先级生成数据筛选策略。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘孟焱
申请(专利权)人:努比亚技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1