【技术实现步骤摘要】
获取用户分类模型的方法、用户分类方法及相关装置
[0001]本专利技术涉及计算机
,尤其涉及一种获取用户分类模型的方法
、
用户分类方法及相关装置
。
技术介绍
[0002]目前,企业或者有关机构能够通过用户针对其自身业务记录的浏览数据来了解并评估用户的浏览习惯以及浏览喜好,以便确定用户的类别,并以此向用户提供定制化服务
。
[0003]相关技术中,在用户浏览数据中搜索预设关键词词表中的关键词,然后根据关键词在用户浏览数据中的出现频率,确定用户的类别,然而,当用户浏览数据的信息量较少时
(
例如,长期未浏览
)
,基于上述方式所确定出的用户的类别的准确性通常不高,且上述方式通常还需要相关人员依据实际业务需求手动维护创建的关键词词表,如此会导致用户分类的成本较高
。
技术实现思路
[0004]本申请提供一种获取用户分类模型的方法
、
用户分类方法及相关装置,用于提升用户分类的准确性并降低成本
。
[0005]第一方面,本申请提供一种获取用户分类模型的方法,包括:
[0006]获取预设时间段内至少一个用户各自的原始浏览数据,每个原始浏览数据至少包括:相应用户在所述预设时间段内浏览的各原始文本,以及各原始文本各自的浏览时间;
[0007]基于每一原始文本中文本元素确定其针对相应原始浏览数据的相似浏览频率,并基于各原始浏览数据及获得的各相似浏览频率,获得至少一个样本浏览数据,每 ...
【技术保护点】
【技术特征摘要】
1.
一种获取用户分类模型的方法,其特征在于,包括:获取预设时间段内至少一个用户各自的原始浏览数据,每个原始浏览数据至少包括:相应用户在所述预设时间段内浏览的各原始文本,以及各原始文本各自的浏览时间;基于每一原始文本中文本元素确定其针对相应原始浏览数据的相似浏览频率,并基于各原始浏览数据及获得的各相似浏览频率,获得至少一个样本浏览数据,每个样本浏览数据用于:表征相应一个用户的浏览喜好;采用至少一个样本浏览数据对预设分类模型进行多轮迭代训练,直至满足预设训练条件,获得训练好的用户分类模型,在一轮训练中,执行以下操作:采用所述分类模型,基于一个用户的样本浏览数据,预测所述一个用户的类别,并基于所述类别,对所述分类模型的模型参数进行调整
。2.
如权利要求1所述的方法,其特征在于,所述基于各原始浏览数据及获得的各相似浏览频率,获得至少一个样本浏览数据,包括:针对各原始浏览数据,分别执行以下操作:从各原始文本中,选取满足预设文本条件的至少一个候选文本,并获取与所述至少一个候选文本相关联的多个补充数据;基于所述多个补充数据
、
所述一个原始浏览数据及其相应各原始文本各自的相似浏览频率,获得一个样本浏览数据
。3.
如权利要求2所述的方法,其特征在于,所述获取与所述至少一个候选文本相关联的多个补充数据,包括以下方式中的任一种或组合:基于预设同义词词表,对一个候选文本中关键词进行同义词替换,并将获得的相应同义词替换文本,作为与所述一个候选文本相关联的一个补充数据;采用预设第一翻译器,对一个候选文本进行语言转换,并采用预设第二翻译器,对相应转换文本进行逆转换,以及将获得的相应回译文本,作为与所述一个候选文本相关联的一个补充数据;在一个候选文本中插入各补充词,并将获得的相应补充插入文本,作为与所述一个候选文本相关联的一个补充数据,其中,所述各补充词是通过所述同义词词表或所述一个候选文本获得的;将一个候选文本输入预设第一语言表征模型,通过所述第一语言表征模型基于所述一个候选文本进行文本掩盖,获得各表征文本,并将各表征文本,分别作为与所述一个候选文本相关联的补充数据;将一个候选文本输入预设第二语言表征模型,通过所述第二语言表征模型基于所述一个候选文本进行文本编码,获得各表征向量,并将各表征向量,分别作为与所述一个候选文本相关联的补充数据
。4.
如权利要求1‑3任一项所述的方法,其特征在于,所述采用所述分类模型,基于一个用户的样本浏览数据,预测所述一个用户的类别,包括:采用所述分类模型,基于所述预设时间段内各目标时间段,确定一个用户的样本浏览数据中各样本浏览子集,并基于各样本浏览子集各自对应的嵌入表示,提取所述一个用户的目标浏览特征,每一嵌入表示至少关联:相应样本浏览子集中各原始文本
、
各浏览时间以及各相似浏览频率;
采用所述分类模型,基于所述目标浏览特征,预测所述一个用户的类别
。5.
如权利要求4所述的方法,其特征在于,所述分类模型是通过
FLASH
模型架构搭建的,所述基于各样本浏览子集各自对应的嵌入表示,提取所述一个用户的目标浏览特征,包括:采用所述分类...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。