标签生成方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:23191005 阅读:19 留言:0更新日期:2020-01-24 16:18
本申请实施例公开了标签生成方法、装置、电子设备和计算机可读介质。该方法的实施例包括:获取多个用户的用户行为数据;分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,目标词包括店菜名称和/或商户名称;将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,主题模型包括各文档的口味标签分布;基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。该实施方式提高了口味标签的精确性。

Label generation methods, devices, electronic devices and computer-readable media

【技术实现步骤摘要】
标签生成方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及标签生成方法、装置、电子设备和计算机可读介质。
技术介绍
在用户点评与用户点菜场景中,用户口味标签是精准刻画一个用户的喜好的重要手段之一。通过对用户口味标签的精准挖掘,能对用户推荐更加精准的店菜或商户,从而可以提升用户点餐时的体验效果。现有的方式,通常是直接获取店菜或商户的口味标签,而后,将用户产生过行为(例如点菜行为、下单行为、点赞行为、收藏行为等)的店菜或商户的口味标签作为该用户的口味标签。然而,这种方式会导致用户的口味标签较多,各用户的口味标签较为相似,从而存在口味标签不够精确的问题。
技术实现思路
本申请实施例提出了标签生成方法、装置、电子设备和计算机可读介质,用以提高口味标签的针对性。第一方面,本申请实施例提供了一种标签生成方法,该方法包括:获取多个用户的用户行为数据;分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,目标词包括店菜名称和/或商户名称;将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,主题模型包括各文档的口味标签分布;基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。第二方面,本申请实施例提供了一种标签生成装置,该装置包括:获取单元,被配置成获取多个用户的用户行为数据;汇总单元,被配置成分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,目标词包括店菜名称和/或商户名称;拟合单元,被配置成以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,主题模型包括各文档的口味标签分布;确定单元,被配置成基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。第三方面,本申请实施例提供了一种标签生成方法,该方法包括:获取目标用户的目标用户行为数据;从目标用户行为数据中提取目标词,并将所提取的目标词汇总为目标文档,其中,目标词包括店菜名称和/或商户名称;基于目标文档的目标词分布和采用预先拟合的主题模型中的主题的目标词分布,确定目标文档的主题分布,其中,主题模型中的主题为口味标签;基于目标文档的主题分布,确定目标用户的目标口味标签。第四方面,本申请实施例提供了一种标签生成装置,该装置包括:获取单元,被配置成获取目标用户的目标用户行为数据;汇总单元,被配置成从目标用户行为数据中提取目标词,并将所提取的目标词汇总为目标文档,其中,目标词包括店菜名称和/或商户名称;第一确定单元,被配置成基于目标文档的目标词分布和采用预先拟合的主题模型中的主题的目标词分布,确定目标文档的主题分布,其中,主题模型中的主题为口味标签;第二确定单元,被配置成基于目标文档的主题分布,确定目标用户的目标口味标签。第五方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面或第三方面所描述的标签生成方法。第六方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面或第三方面所描述的标签生成方法。本申请实施例提供的标签生成方法、装置、电子设备和计算机可读介质,通过获取多个用户的用户行为数据,以便分别从各用户行为数据中提取目标词并获取各目标词的口味标签。此处,目标词包括店菜名称和/或商户名称。之后将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,所述主题模型包括各文档的口味标签分布。最后基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。由此,通过主题模型拟合出各文档的口味标签分布。由于主题模型可以准确且具有针对性地拟合出文档的主题(即口味标签),因而可使所确定出各用户的口味标签更具有针对性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是根据本申请的标签生成方法的一个实施例的流程图;图2是根据本申请的标签生成方法的一个实施例的流程图;图3是根据本申请的标签生成方法的一个实施例的流程图;图4是根据本申请的标签生成装置的一个实施例的结构示意图;图5是根据本申请的标签生成装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。请参考图1,其示出了根据本申请的标签生成方法的一个实施例的流程100。该标签生成方法,包括以下步骤:步骤101,获取多个用户的用户行为数据。在本实施例中,标签生成方法的执行主体(例如服务器等电子设备)可以获取多个用户的用户行为数据。其中,上述用户行为数据可以是用户在使用某个指定客户端(例如具有美食点评、点菜等功能的客户端)时所产生的行为数据。此处,上述用户行为数据可在用户产生用户行为时生成。上述用户行为可以包括但不限于点菜行为、下单行为、评论行为、浏览行为、收藏行为、转发行为、点赞行为等。实践中,用户行为数据可以包括但不限于与用户行为相关的店菜名称、商户名称等。例如,用户在商户A所经营的餐品中下单了店菜B和店菜C。此时,则与该用户行为对应的用户行为数据中可以包含商户A的名称、店菜B的名称和店菜C的名称。步骤102,分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签。在本实施例中,上述执行主体可以分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签。其中,目标词可以包括店菜名称和/或商户名称。在一种场景中,商户的经营人员可以人工为自己经营的商户和店菜设定口味标签。此时,上述执行主体可以直接将经营人员自行设定的口味标签,作为相应的目标词的口味标签。作为示例,某个商户A(例如名称为“XX川菜馆”)经营川菜,则该商户的经营人员可以将该商户A的口味标签设定为“辣”。该商户A中经营有店菜“宫保鸡丁”和“红糖糍粑”,则该商户A的经营人员可以将店菜“宫保鸡丁”的口味标签设定为“辣”,将店菜“红糖糍粑”的口味标签设定为“甜”。此时,上述执行主体所获取的目标词“XX川菜馆”和“宫保鸡丁”的口味标签即为“辣”,目标词“红糖糍粑”的口味标签即为“甜”。在另一种场景中,上述执行主体可以从互联网(例如菜谱网站)中查询各个目标词的口味,并将所查询到的口味作为口味标签。此处,可以采用多种方式获取口味标签,不限于上述各场景中的所描述的方式。步骤103本文档来自技高网...

【技术保护点】
1.一种标签生成方法,其特征在于,所述方法包括:/n获取多个用户的用户行为数据;/n分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,所述目标词包括店菜名称和/或商户名称;/n将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,所述主题模型包括各文档的口味标签分布;/n基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。/n

【技术特征摘要】
1.一种标签生成方法,其特征在于,所述方法包括:
获取多个用户的用户行为数据;
分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,所述目标词包括店菜名称和/或商户名称;
将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,所述主题模型包括各文档的口味标签分布;
基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。


2.根据权利要求1所述的标签生成方法,其特征在于,所述基于各文档和各口味标签,拟合主题模型,包括:
对各文档中的各目标词设定权重,统计各文档的目标词分布;
基于各文档的目标词分布和各文档中的各目标词的权重,拟合包含各口味标签的目标词分布和各文档的口味标签分布的主题模型。


3.根据权利要求2所述的标签生成方法,其特征在于,对各文档中的各目标词设定权重,包括:
确定各用户行为数据对应的行为类别;
基于预设的各行为类别的权重,获取各用户行为数据的权重;
对于每一个目标词,将该目标词所属的用户行为数据的权重,作为该目标词的权重。


4.根据权利要求3所述的标签生成方法,其特征在于,所获取的各用户行为数据的权重还与各用户行为数据的产生时间有关。


5.根据权利要求2所述的标签生成方法,其特征在于,所述基于各文档的目标词分布和各文档中的各目标词的权重,拟合包含各口味标签对应的词语分布和各文档的口味标签分布的主题模型,包括:
对于每一个文档,执行如下拟合步骤:对预设的第一狄利克雷分布进行取样,生成该文档的取样口味标签分布,其中,所述取样口味标签分布为多项式分布;对所述取样口味标签分布进行取样,得到取样口味标签;对预设的第二狄利克雷分布进行取样,生成对应所述取样口味标签的取样目标词分布,其中,所述取样目标词分布为多项式分布;按照该文档中的各目标词的权重,对所述取样目标词分布进行取样,得到取样目标词;将所得到的各取样目标词汇总为该文档对应的生成文档;
基于各文档的目标词分布和各文档对应的生成文档的取样目标词分布,利用最大期望算法拟合各口味标签的目标词分布和各文档的口味标签分布。


6.根据权利要求1所述的标签生成方法,其特征在于,所述基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签,包括:
对于每一个文档,按照口味标签的概率由大到小的顺序,选取预设数量的口味标签,将所选取的口味标签确定为该文档对应的用户的目标口味标签。


7.根据权利要求1所述的标签生成方法,其特征在于,在所述基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签之后,所述方法还包括:
从所述多个用户中选取目标用户;
查询与所述目标用户的目标口味标签相匹配的信息,其中,所述信息包括店菜信息和商户信息;
向所述目标用户推送所述信息。


8.一种标签生成...

【专利技术属性】
技术研发人员:马玉昆
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1