信息处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:17995724 阅读:47 留言:0更新日期:2018-05-19 12:47
本公开实施例公开了一种信息处理方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取用户类别训练数据集,其中,所述用户类别训练数据集包括具有重要性权重的用户类别训练数据,所述用户类别训练数据的重要性权重是根据预设类别用户的用户数据和待测用户的用户数据计算出的;获取待测用户的待测用户数据集;对所述用户类别训练数据集进行训练,得到信息处理模型;将所述待测用户数据集中的待测用户数据输入至所述信息处理模型,对待测用户进行预设类别预测。从而不需要不断维护用户分类规则,而是只需要维护信息处理模型就可以对待测用户进行分类,因此便于维护,并且提高了待测用户分类的准确性和覆盖度。

【技术实现步骤摘要】
信息处理方法、装置、电子设备及计算机可读存储介质
本公开涉及数据挖掘
,具体涉及一种信息处理方法、装置及电子设备。
技术介绍
随着信息技术的发展,互联网已经深入到各个领域。网络上出现了众多的购物平台、外卖平台、租房平台、打车平台等信息平台。这些信息平台上的信息、产品或服务的提供方(简称为商户)会提供各种各样的信息、产品或服务。这些信息、产品或服务种类繁多,信息量大,且经常变化,若要从中挖掘出有价值的内容并非易事。而且,信息平台对用户的个性化推荐需要依靠商户画像的刻画,而商户画像中该商户所提供的产品和服务的类别是最重要的指标之一,根据商户在信息平台上的信息,挖掘商户产品和服务的类别可以提高信息平台的用户的体验度和下单转化率。
技术实现思路
在实际应用中,专利技术人发现:相关技术中,信息平台对商户(目标用户)的产品和服务的类别挖掘主要依赖人工制定规则匹配出产品和服务的类别,对匹配的结果计数并排序,最后筛选出产品和服务的项目最多的类别为商户类别。但是,在人工制定类别匹配规则时,前期需要花大量人力收集产品和服务对应的类别映射关系并且类别匹配规则维护性不佳。此外,因为无法穷举所有产品和服务的本文档来自技高网...
信息处理方法、装置、电子设备及计算机可读存储介质

【技术保护点】
一种信息处理方法,其特征在于,包括:获取用户类别训练数据集,其中,所述用户类别训练数据集包括具有重要性权重的用户类别训练数据,所述用户类别训练数据的重要性权重是根据预设类别用户的用户数据和待测用户的用户数据计算出的;获取待测用户的待测用户数据集;对所述用户类别训练数据集进行训练,得到信息处理模型;将所述待测用户数据集中的待测用户数据输入至所述信息处理模型,对待测用户进行预设类别预测。

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取用户类别训练数据集,其中,所述用户类别训练数据集包括具有重要性权重的用户类别训练数据,所述用户类别训练数据的重要性权重是根据预设类别用户的用户数据和待测用户的用户数据计算出的;获取待测用户的待测用户数据集;对所述用户类别训练数据集进行训练,得到信息处理模型;将所述待测用户数据集中的待测用户数据输入至所述信息处理模型,对待测用户进行预设类别预测。2.根据权利要求1所述的方法,其特征在于,其中,所述待测用户数据集包括具有重要性权重的待测用户数据,所述待测用户数据的重要性权重是根据预设类别用户的用户数据和待测用户的用户数据计算出的。3.根据权利要求2所述的方法,其特征在于,所述获取用户类别训练数据集,包括:获取用户数据,所述用户数据包括预设类别用户的用户数据和所述待测用户的用户数据;获取用户类别特征数据;关联所述用户数据与用户类别特征数据,得到用户类别训练数据集,所述用户类别训练数据集包括具有重要性权重的用户类别训练数据,所述用户类别训练数据的重要性权重是根据预设类别用户的用户数据和待测用户的用户数据计算出的。4.根据权利要求3所述的方法,其特征在于,所述获取待测用户的待测用户数据集,包括:关联所述用户数据与用户类别特征数据,得到待测用户数据集,所述待测用户数据集包括具有重要性权重的待测用户数据,所述待测用户数据的重要性权重是根据预设类别用户的用户数据和待测用户的用户数据计算出的。5.根据权利要求3所述的方法,其特征在于,所述获取用户类别特征数据,包括:对所述用户数据进行分词以得到用户字典,其中,所述用户字典包括...

【专利技术属性】
技术研发人员:姜谷雨
申请(专利权)人:北京小度信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1