【技术实现步骤摘要】
特异化数据的对象特征生成方法、装置、设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种特异化数据的对象特征生成方法、装置、设备及存储介质。
技术介绍
在通过机器学习获取数据的特征结果时,需要进行数据对象特征生成和筛选来提高机器学习的精准度,从而得到满足条件的对象特征生成结果,现有机器学习的特征生成方法没有针对特异化的数据进行优化,而是直接调用特征生成工具自动生成大量的对象特征。专利技术人意识到,现有技术存在以下几点问题:通过现有的特征生成方法或者工具生成特征时,其对象特征的增长有时会接近于指数增长,从而生成成千上万的对象特征,在计算时会耗费大量的计算资源,这些对象特征往往含有大量的无意义以及强相关的变量,这些强相关的变量不仅会占用系统内存,还会影响机器学习的精度。而且基于生成的全部对象特征进行特征筛选增加了误差传递的概率。
技术实现思路
有鉴于此,本专利技术提出一种特异化数据的对象特征生成方法、装置、设备及存储介质,能够在生成对象特征时,优化对象特中大量的无意义以及强相关的变量, ...
【技术保护点】
1.一种特异化数据的对象特征生成方法,其特征在于,所述方法包括:/n获取所述特异化数据并进行预处理;/n对所述特异化数据进行因子分析以得到所述特异化数据不同因子,并获取每个因子中的隐性对象特征;/n根据所述不同因子生成所述特异化数据的多个初始对象特征,并对所述多个初始对象特征进行筛选生成优化对象特征;/n输出所述隐性对象特征和所述优化对象特征,以得到所述特异化数据的对象特征结果。/n
【技术特征摘要】
1.一种特异化数据的对象特征生成方法,其特征在于,所述方法包括:
获取所述特异化数据并进行预处理;
对所述特异化数据进行因子分析以得到所述特异化数据不同因子,并获取每个因子中的隐性对象特征;
根据所述不同因子生成所述特异化数据的多个初始对象特征,并对所述多个初始对象特征进行筛选生成优化对象特征;
输出所述隐性对象特征和所述优化对象特征,以得到所述特异化数据的对象特征结果。
2.如权利要求1所述的特异化数据的对象特征生成方法,其特征在于,所述获取所述特异化数据并进行预处理包括:
当所述特异化数据的字段数据值超过预设范围值时,将所述数据值置空;
当所述特异化数据的字段数据值缺失高于预设阈值时,将所述数据值删除;
当所述特异化数据的字段数据值缺失不高于预设阈值时,将所述数据值用所述数据值的均值替换以及执行归一化。
3.如权利要求1或2所述的特异化数据的对象特征生成方法,其特征在于,所述对所述特异化数据进行因子分析以得到所述特异化数据不同因子,并提取不同因子中的隐性对象特征包括:
对所述特异化数据进行适合度检验以得到检验值;
当所述检验值满足预设条件时进行所述因子分析;
根据预设或输入的因子个数提取多个因子,并获取每个因子对应的所述隐性对象特征数据。
4.如权利要求3所述的特异化数据的对象特征生成方法,其特征在于,所述根据所述不同因子生成所述特异化数据的多个初始对象特征,并对所述多个初始对象特征进行筛选生成优化对象特征包括:
自定义对象特征的生成阶数;
根据所述生成阶数对不同因子的所述特异化数据进行聚合和转换以生成多个初始对象特征;
当所述生成阶数为一阶时对所述多个初始对象特征进行相关性计算以生成第一对象特征;
当所述生成阶数为多阶时拼接每一阶生成的所述第一对象特征以得到第二对象特征;
输出所述第一对象特征和所述第二对象特征以得到所述优化对象特征。
5.如权利要求4所述的特异化数据的对象特征生成方法,其特征在于,所述根据所述不同因子生成所述特异化数据的多个初始对象特征,并对所述多个初始对象特征进行筛选生成优化对象特征还包括:
自定义对象特征的生成函数;
根据所述生成函数...
【专利技术属性】
技术研发人员:宋威,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。