【技术实现步骤摘要】
生成标签的方法、装置、服务器和存储介质
本专利技术一般地涉及互联网
,更具体地涉及一种生成标签的方法、装置、服务器和存储介质。
技术介绍
随着互联网技术的快速发展,人们越来越多地通过互联网购买商品以及浏览其他人发布的信息。其中,标签可以帮助用户快速获得关键信息,从而辅助用户挑选适合的商品或者选择是否继续浏览信息。目前为特定目标确定标签的一种方法是预先定义固定标签,用户发表点评时从固定标签中进行选择。这种方法的缺点是固定标签数量受限,无法覆盖用户的全部需求,并且标签和用户内容可能不匹配。另一种确定标签的方法是对用户发布的点评内容进行句法解构,提取主题词和描述词组合后作为标签。在评价量非常大的时候,这种方法会产生大量的标签,对计算性能要求高并且维护不便。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提供一种生成标签的方法、装置、服务器和存储介质,以动态生成标签,并降低计算性能要求。本专利技术的一个方面提供了一种生成标签的方法,所述方法包括:获取预先存储的参考句式,其中,所述参考句式包括具有逻辑关系的多个参考词组,所述多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;按照逐个参考词组匹配的方式,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,所述匹配参考词语是所述一个或多个参考词语中与所述评价子句相匹配的参考词语;以及根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签。本专利技术的另一方面提供了一种生成标签的装置,该装置包括:句式获取模块,配置用于获取预先存储的参 ...
【技术保护点】
1.一种生成标签的方法,其特征在于,所述方法包括:获取预先存储的参考句式,其中,所述参考句式包括具有逻辑关系的多个参考词组,所述多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;按照逐个参考词组匹配的方式,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,所述匹配参考词语是所述一个或多个参考词语中与所述评价子句相匹配的参考词语;以及根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签。
【技术特征摘要】
1.一种生成标签的方法,其特征在于,所述方法包括:获取预先存储的参考句式,其中,所述参考句式包括具有逻辑关系的多个参考词组,所述多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;按照逐个参考词组匹配的方式,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,所述匹配参考词语是所述一个或多个参考词语中与所述评价子句相匹配的参考词语;以及根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签。2.根据权利要求1所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配包括:当在当前参考词组中匹配到匹配参考词语时,跳过所述当前参考词组中未进行匹配的参考词语与所述评价文本的匹配。3.根据权利要求1所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配包括:针对包括多个参考词语的参考词组,根据所述参考词组中的所述多个参考词语的顺序,将所述多个参考词语与所述评价文本进行匹配,其中,所述顺序是根据所述多个参考词语在之前评价中出现的频率和/或次数而排列的。4.根据权利要求1所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配包括:根据所述逻辑关系指定的词组顺序,将所述多个参考词组与所述评价子句进行匹配;在进行匹配的参考词组中获得匹配参考词语之后,将所述参考句式中根据所述词组顺序确定的下一个参考词组,与所述评价子句进行匹配;其中,所述下一个参考词组是与匹配到匹配参考词语的参考词组顺序相邻且未进行匹配的参考词组,在与所述下一个参考词组进行匹配时,所述评价子句中开始的位置是与所述匹配参考词语相匹配的匹配评价词语所在位置的下一位。5.根据权利要求4所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,还包括:在进行匹配的参考词组中没有获得匹配参考词语时,终止所述参考句式与所述评价子句的匹配。6.根据权利要求1所述的方法,其特征在于,在根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签之前,所述方法还包括:确定所述参考句式与所述评价子句相匹配。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:在确定所述参考句式与所述评价子句不相匹配时,取消生成标签。8.根据权利要求7所述的方法,其特征在于,确定所述参考句式与所述评价子句不相匹配包括:将与相邻的参考词组中的匹配参考词语相匹配的匹配评价词语在所述评价子句中的词距与第二预定阈值进行比较;以及在所述词距大于所述第二预定阈值时,确定所述参考句式与所述评价子句不相匹配。9.根据权利要求7所述的方法,其特征在于,确定所述参考句式与所述评价子句不相匹配包括:判断所述评价子句中在与所述匹配参考词语相匹配的匹配评价词语之前是否具有否定词;如果具有否定词,则确定所述参考句式与所述评价子句不相匹配。10.根据权利要求7所述的方法,其特征在于,确定所述参考句式与所述评价子句不相匹配包括:在所述匹配参考词语是易混淆词时,判断与所述易混淆词相对应的混淆词是否出现在所述评价子句中与所述易混淆词语义关联的位置,所述易混淆词与所述混淆词之间具有所述语义关联的位置关系;如果所述混淆词出现在与所述易混淆词语...
【专利技术属性】
技术研发人员:乔志军,李鑫,王建华,陈雪,
申请(专利权)人:北京创鑫旅程网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。