上海冰鉴信息科技有限公司专利技术

上海冰鉴信息科技有限公司共有98项专利

  • 本发明所提供的针对不平衡样本数据的数据处理方法及装置,能够基于第一目标样本构造第二目标样本,并将第一目标样本和第二目标样本进行整合得到采样样本集,本方案的扩充样本的方法避免了简单的欠采样技术导致的信息丢失的问题,在样本较少的情况下,也不...
  • 本发明提供的基于树模型的业务处理方法、装置及电子设备,获取多组原始业务数据,基于设定模型对每组原始业务数据进行训练,并获取设定模型针对每组原始业务数据的样本预测结果;根据所述样本预测结果确定样本预测分数;对所述设定模型进行校验,得到校验...
  • 本发明的基于联合模型的数据处理方法及装置,将获取到的原始样本划分为训练集和测试集;并根据训练集确定出第一训练样本、第二训练样本和第三训练样本,进而分别拟合第一训练样本、第二训练样本和第三训练样本得到对应的逻辑回归模型以及对应的评价指标,...
  • 本申请实施例提供一种基于知识图谱的业务关系处理方法及装置,在业务关系处理过程中初始业务指标属性值可以根据预设的业务指标属性值规则的匹配情况而变化,并且关系类型对应的关系属性传导权重可以根据业务对象的初始业务指标属性值和每个关系类型对应的...
  • 本发明所提供的无监督的数据分箱方法及装置,能够在原始值中存在缺失值时,将原始值中的所有缺失值设定为第一组分箱并对第一组分箱设置第一分箱编码;在去除缺失值之后如果第一剩余特征值均为同一固定值则将第一剩余特征值设定为第二组分箱,并对第二组分...
  • 本发明所提供的基于业务处理的机器学习模型选择方法及装置,能够确定建模样本数据的训练样本数据和测试样本数据,对训练样本数据的原始特征变量集进行筛选得到第一特征变量集,对训练样本数据进行建模并对第一特征变量集进行筛选得到第二特征变量集,采用...
  • 本申请实施例提供一种分布式模型计算控制方法及装置,通过集群执行程序建立多个集群计算容器,并将模型计算指令所对应的Json数据的目标用户计算模型以及目标用户计算模型的关联依赖文件添加到集群执行程序运行的临时空间以供多个集群计算容器共享调用...
  • 本发明所提供的数据特征确定方法、装置及电子设备,允许在初始阶段设定已选特征集合和必不选特征集合,对特征选择添加了先验特征,减少了不必要特征筛选的计算量。对特征使用了方差膨胀因子指标进行筛选,减少了特征之间存在多重共线性的可能性,有效降低...
  • 本发明实施例所提供的业务数据处理方法及计算机设备,能够在第一业务区域和第二业务区域下都能够有效获取建模数据的场景下,利用算法的设计,在逐步迭代中有效提高原有模型样本中与第二业务区域中类似的样本的权重,同时减少原有模型中的非类似样本的权重...
  • 本申请实施例提供一种用户信息分类方法及装置,在对具有标签的第一训练特征变量进行模型训练得到第一用户信息分类模型的基础上,通过采用无监督算法对中间状态的第二训练特征变量进行聚类后确定标签,从而拓宽了人工标识的局限,并且利用确定标签后的第二...
  • 本发明实施例所提供的样本数据处理方法、装置及计算机设备,首先获取待处理样本数据并确定多个类别标签,根据类别标签将待处理样本数据划分为多个样本子集,其次根据接收到的业务需求信息将多个类别标签进行排序得到类别排序队列,最后依次为类别排序队列...
  • 本发明实施例所提供的数据处理方法、装置及计算机设备,首先获取第一样本数据并确定目标模型及其对应的特征集合,其次获取第二样本数据并将第二样本数据按照设定比例或设定时间顺序划分为开发数据集和验证数据集,然后基于目标模型、目标模型对应的特征集...
  • 本申请实施例提供一种业务预测方法及装置,在考虑业务验证通过的业务样本的同时,兼顾了部分业务验证被拒绝的业务样本的数据特征,比较真实地还原了业务场景,减少了拒绝样本的成本浪费,尤其是在业务验证通过的样本量不充分的情况下,合理地均衡了建模样...
  • 本申请实施例提供一种业务分类方法及装置,通过对未进入业务分类模型的特征进行进一步的特征衍生,从而通过筛选获得具有新的含义且更利于模型计算的衍生特征集合,从而进一步挖掘衍生特征的数据价值,为业务分类模型补充数据维度和属性信息,提高业务分类...
  • 本发明实施例所提供的数据特征的筛选方法、装置及计算机设备,由于本发明在筛选时利用相关系数剔除了大部分趋势波动较大的特征,整个过程仅涉及相关性的计算,没有可视化的必要,因此整体上速率更快、效率更高。通过整个过程的筛选,精简了最终入模的变量...
  • 本发明实施例所提供的用户行为检测方法及装置,首先对采集到的用户行为数据设置行为标签,其次根据每组用户行为数据对应的行为数据特征为每组用户行为数据对应的行为标签设置对应的标签权重值,然后基于标签权重值、行为标签以及用户行为数据特征确定多组...
  • 本申请实施例提供一种基于文本列表的用户特征提取方法及装置,通过将用户的应用安装列表信息转化成文本信息列表,并通过LDA话题模型将文本信息列表转化为话题特征向量,再将提取出的话题特征向量输入到目标风控模型中对目标风控模型进行决策输出。如此...
  • 本发明实施例所提供的基于二分类业务的数据特征选择方法、装置及计算机设备,采用提取得到的初始特征组合对第一树模型进行训练并获取初始增益贡献值并从n个初始数据特征筛选出m个第一数据特征,确定第一数据特征对应的相关性系数以及特征iv值,基于相...
  • 本申请实施例提供一种基于计算机视觉的事件测试方法及装置,可以根据每个测试应用程序的程序类型所对应的程序加载方式依次加载每个测试应用程序,从而对多种程序类型的测试应用程序进行测试,提高了自动功能测试的覆盖面,此外通过计算机视觉的模拟测试方...
  • 本发明提供的基于多平台样本的数据分类方法及装置,没有对合并样本进行聚类运算,能够极大减少对计算机运行内存的消耗,减少多平台样本分类所需的运行时。进一步地,由于以模型预估概率计算的相关系数矩阵为数据基础,以平台为最小聚类单位,使得样本分类...