【技术实现步骤摘要】
标签生成方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及标签生成方法、装置、电子设备和计算机可读介质。
技术介绍
在用户点评与用户点菜场景中,用户口味标签是精准刻画一个用户的喜好的重要手段之一。通过对用户口味标签的精准挖掘,能对用户推荐更加精准的店菜或商户,从而可以提升用户点餐时的体验效果。现有的方式,通常是直接获取店菜或商户的口味标签,而后,将用户产生过行为(例如点菜行为、下单行为、点赞行为、收藏行为等)的店菜或商户的口味标签作为该用户的口味标签。然而,这种方式会导致用户的口味标签较多,各用户的口味标签较为相似,从而存在口味标签不够精确的问题。
技术实现思路
本申请实施例提出了标签生成方法、装置、电子设备和计算机可读介质,用以提高口味标签的针对性。第一方面,本申请实施例提供了一种标签生成方法,该方法包括:获取多个用户的用户行为数据;分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,目标词包括店菜名称和/或商户名称;将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,主题模型包括各文档的口味标签分布;基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。第二方面,本申请实施例提供了一种标签生成装置,该装置包括:获取单元,被配置成获取多个用户的用户行为数据;汇总单元,被配置成分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,目标词包括店菜名称和/ ...
【技术保护点】
1.一种标签生成方法,其特征在于,所述方法包括:/n获取多个用户的用户行为数据;/n分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,所述目标词包括店菜名称和/或商户名称;/n将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,所述主题模型包括各文档的口味标签分布;/n基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。/n
【技术特征摘要】
1.一种标签生成方法,其特征在于,所述方法包括:
获取多个用户的用户行为数据;
分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,所述目标词包括店菜名称和/或商户名称;
将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,所述主题模型包括各文档的口味标签分布;
基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。
2.根据权利要求1所述的标签生成方法,其特征在于,所述基于各文档和各口味标签,拟合主题模型,包括:
对各文档中的各目标词设定权重,统计各文档的目标词分布;
基于各文档的目标词分布和各文档中的各目标词的权重,拟合包含各口味标签的目标词分布和各文档的口味标签分布的主题模型。
3.根据权利要求2所述的标签生成方法,其特征在于,对各文档中的各目标词设定权重,包括:
确定各用户行为数据对应的行为类别;
基于预设的各行为类别的权重,获取各用户行为数据的权重;
对于每一个目标词,将该目标词所属的用户行为数据的权重,作为该目标词的权重。
4.根据权利要求3所述的标签生成方法,其特征在于,所获取的各用户行为数据的权重还与各用户行为数据的产生时间有关。
5.根据权利要求2所述的标签生成方法,其特征在于,所述基于各文档的目标词分布和各文档中的各目标词的权重,拟合包含各口味标签对应的词语分布和各文档的口味标签分布的主题模型,包括:
对于每一个文档,执行如下拟合步骤:对预设的第一狄利克雷分布进行取样,生成该文档的取样口味标签分布,其中,所述取样口味标签分布为多项式分布;对所述取样口味标签分布进行取样,得到取样口味标签;对预设的第二狄利克雷分布进行取样,生成对应所述取样口味标签的取样目标词分布,其中,所述取样目标词分布为多项式分布;按照该文档中的各目标词的权重,对所述取样目标词分布进行取样,得到取样目标词;将所得到的各取样目标词汇总为该文档对应的生成文档;
基于各文档的目标词分布和各文档对应的生成文档的取样目标词分布,利用最大期望算法拟合各口味标签的目标词分布和各文档的口味标签分布。
6.根据权利要求1所述的标签生成方法,其特征在于,所述基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签,包括:
对于每一个文档,按照口味标签的概率由大到小的顺序,选取预设数量的口味标签,将所选取的口味标签确定为该文档对应的用户的目标口味标签。
7.根据权利要求1所述的标签生成方法,其特征在于,在所述基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签之后,所述方法还包括:
从所述多个用户中选取目标用户;
查询与所述目标用户的目标口味标签相匹配的信息,其中,所述信息包括店菜信息和商户信息;
向所述目标用户推送所述信息。
8.一种标签生成...
【专利技术属性】
技术研发人员:马玉昆,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。