生成标签的方法、装置、服务器和存储介质制造方法及图纸

技术编号:19692690 阅读:27 留言:0更新日期:2018-12-08 11:24
本发明专利技术的方面涉及生成标签的方法、装置、服务器和计算机可读介质。生成标签的方法包括:获取预先存储的参考句式,其中,参考句式包括具有逻辑关系的多个参考词组,多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;按照逐个参考词组匹配的方式,将多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,匹配参考词语是一个或多个参考词语中与评价子句相匹配的参考词语;以及根据匹配参考词语以及匹配参考词语所属的参考词组的所述逻辑关系生成标签。本发明专利技术的技术方案能够动态地生成标签,使标签更加多样化和个性化,更好地覆盖用户评价,提高了召回率。

【技术实现步骤摘要】
生成标签的方法、装置、服务器和存储介质
本专利技术一般地涉及互联网
,更具体地涉及一种生成标签的方法、装置、服务器和存储介质。
技术介绍
随着互联网技术的快速发展,人们越来越多地通过互联网购买商品以及浏览其他人发布的信息。其中,标签可以帮助用户快速获得关键信息,从而辅助用户挑选适合的商品或者选择是否继续浏览信息。目前为特定目标确定标签的一种方法是预先定义固定标签,用户发表点评时从固定标签中进行选择。这种方法的缺点是固定标签数量受限,无法覆盖用户的全部需求,并且标签和用户内容可能不匹配。另一种确定标签的方法是对用户发布的点评内容进行句法解构,提取主题词和描述词组合后作为标签。在评价量非常大的时候,这种方法会产生大量的标签,对计算性能要求高并且维护不便。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提供一种生成标签的方法、装置、服务器和存储介质,以动态生成标签,并降低计算性能要求。本专利技术的一个方面提供了一种生成标签的方法,所述方法包括:获取预先存储的参考句式,其中,所述参考句式包括具有逻辑关系的多个参考词组,所述多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;按照逐个参考词组匹配的方式,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,所述匹配参考词语是所述一个或多个参考词语中与所述评价子句相匹配的参考词语;以及根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签。本专利技术的另一方面提供了一种生成标签的装置,该装置包括:句式获取模块,配置用于获取预先存储的参考句式,其中,所述参考句式包括具有逻辑关系的多个参考词组,所述多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;词组匹配模块,配置用于按照逐个参考词组匹配的方式,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,所述匹配参考词语是所述一个或多个参考词语中与所述评价子句相匹配的参考词语;以及标签生成模块,配置用于根据所述词组匹配模块获得的所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签。本专利技术的又一方面提供了一种服务器,所述服务器包括:存储器,配置用于存储指令;以及处理器,配置用于调用所述指令执行本专利技术的上述方面的生成标签的方法。本专利技术的又一方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在由处理器执行时,执行本专利技术的上述方面的生成标签的方法。本专利技术的方面提供的用于生成标签的方案通过预先存储包括参考词组的参考句式,减少了固定标签的数量,通过参考词组组合而成的参考句式与评价文本进行匹配,能够根据不同的评价文本而动态地生成标签,参考词组中包括一个或多个语义关联的参考词组,使标签更加多样化和个性化,更好地覆盖了用户评价,提高了召回率。附图说明通过参考附图阅读下文的详细描述,本专利技术实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:图1示出了根据本专利技术的一个实施方式的用于生成标签的方法的流程图;图2示出了根据本专利技术的另一实施方式的用于生成标签的方法的流程图;图3示出了根据本专利技术的又一实施方式的用于生成标签的方法的流程图;图4示出了根据本专利技术的一个实施方式的用于生成标签的方法的补充步骤的流程图;图5示出了根据本专利技术的一个实施方式的用于生成标签的装置的框图;图6示出了根据本专利技术的另一实施方式的用于生成标签的装置的框图;图7示出了根据本专利技术的又一实施方式的用于生成标签的装置的框图;以及图8示出了根据本专利技术的一个实施方式的用于生成标签的装置的补充模块的框图。在附图中,相同或对应的标号表示相同或对应的部分。具体实施方式下面将参考若干示例性实施方式来描述本专利技术的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。需要注意,虽然本文中使用“第一”、“第二”等表述来描述本专利技术的实施方式的不同模块、步骤和数据等,但是“第一”、“第二”等表述仅是为了在不同的模块、步骤和数据等之间进行区分,而并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。如图1所示,本专利技术的一个实施方式提出了一种用于生成标签的方法100。在一些实施方式中,方法100可以针对特定评价目标而执行,特定评价目标例如某个具体的餐厅、酒店、电影院、理发店、旅游景点等等。备选地,方法100也可以针对多个评价目标的集合而执行。在一些实施方式中,方法100可以在第三方评价服务提供者的服务器上执行。例如,服务器可以是本地服务器或者云服务器。如图1所示,方法100包括步骤S101-S103。在步骤S101中,获取预先存储的参考句式。在一些实施方式中,参考句式可以包括具有逻辑关系的多个参考词组,多个参考词组中的每个参考词组可以包括语义相关联的一个或多个参考词语。参考句式可以存储为参考句式库,该参考句式库例如可以存储在执行方法100的服务器本地的存储器上,或者可以存储在与服务器进行通信的外部存储器上。在一些实施方式中,逻辑关系可以包括位置关系、顺序关系、逻辑与(AND)、逻辑或(OR)、逻辑非(NOT)、逻辑与非、逻辑或非、逻辑异或(XOR)、逻辑同或中的一个或多个。当然,也可以包括其他逻辑关系。作为示例,在“{位于}AND[{地铁站}OR{码头}OR{公交站}OR{火车站}OR{机场}OR{市中心}]AND{附近}”格式的参考句式中,参考词组“地铁站”、“码头”、“公交站”、“机场”、“市中心”之间是逻辑“或(OR)”的关系。“位于”和“附近”与其之间的词组是逻辑“与(AND)”的关系。在一些实施方式中,每个参考句式可以表示一种逻辑语义,其通过参考词组之间的组合定义参考句式,表达不同内容。每个参考句式可以具有唯一标识。举例而言,描述距离地铁站近的评价,可以由参考句式{离}{地铁站}{近}表示,其中离、地铁站、近是代表这类词语的词组。在一些实施方式中,参考词组可以存储在参考词组库中。参考词组库由参考词组以及其包含的参考词语组成。每个参考词组和每个参考词语可以分别具有唯一标识符。在一些实施方式中,参考词组可以包括普通词组、独立词组、感兴趣点(PointofInterest,POI)词组、固定文字和/或专属词组。在一些实施方式中,参考词组是对其包含的参考词语的概括和汇总,参考词语为表示该参考词组的近义词、俗语、舶来词、英语、缩写等。例如,代表班车的词组中可以包括与班车意思相同或相近的多个词语:班车、摆渡车、接驳车等等。代表地铁站的参考词组里的参考词语可以是地铁站,捷运站,快轨站轻轨等。在一些实施方式中,参考词组也可以包括一类描述信息,比如距离近的集合,可以包括“近”、“不远”、“很近”、“走路1分钟”等参考词语。在一些实施方式中,普通词组可以表示一般含义的词组,每个词组含有表示相同含义的词语。在一些实施方式中,独立词组可以是可以应用于相同句式中的并列的不同含义的词组。作为示例,多个独立词组在一个句式中以或(OR)逻辑进行组合。例如,在“本文档来自技高网...

【技术保护点】
1.一种生成标签的方法,其特征在于,所述方法包括:获取预先存储的参考句式,其中,所述参考句式包括具有逻辑关系的多个参考词组,所述多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;按照逐个参考词组匹配的方式,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,所述匹配参考词语是所述一个或多个参考词语中与所述评价子句相匹配的参考词语;以及根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签。

【技术特征摘要】
1.一种生成标签的方法,其特征在于,所述方法包括:获取预先存储的参考句式,其中,所述参考句式包括具有逻辑关系的多个参考词组,所述多个参考词组中的每个参考词组包括语义相关联的一个或多个参考词语;按照逐个参考词组匹配的方式,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,获得匹配参考词语,所述匹配参考词语是所述一个或多个参考词语中与所述评价子句相匹配的参考词语;以及根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签。2.根据权利要求1所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配包括:当在当前参考词组中匹配到匹配参考词语时,跳过所述当前参考词组中未进行匹配的参考词语与所述评价文本的匹配。3.根据权利要求1所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配包括:针对包括多个参考词语的参考词组,根据所述参考词组中的所述多个参考词语的顺序,将所述多个参考词语与所述评价文本进行匹配,其中,所述顺序是根据所述多个参考词语在之前评价中出现的频率和/或次数而排列的。4.根据权利要求1所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配包括:根据所述逻辑关系指定的词组顺序,将所述多个参考词组与所述评价子句进行匹配;在进行匹配的参考词组中获得匹配参考词语之后,将所述参考句式中根据所述词组顺序确定的下一个参考词组,与所述评价子句进行匹配;其中,所述下一个参考词组是与匹配到匹配参考词语的参考词组顺序相邻且未进行匹配的参考词组,在与所述下一个参考词组进行匹配时,所述评价子句中开始的位置是与所述匹配参考词语相匹配的匹配评价词语所在位置的下一位。5.根据权利要求4所述的方法,其特征在于,将所述多个参考词组中每个参考词组中的一个或多个参考词语与评价子句进行匹配,还包括:在进行匹配的参考词组中没有获得匹配参考词语时,终止所述参考句式与所述评价子句的匹配。6.根据权利要求1所述的方法,其特征在于,在根据所述匹配参考词语以及所述匹配参考词语所属的参考词组的所述逻辑关系生成标签之前,所述方法还包括:确定所述参考句式与所述评价子句相匹配。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:在确定所述参考句式与所述评价子句不相匹配时,取消生成标签。8.根据权利要求7所述的方法,其特征在于,确定所述参考句式与所述评价子句不相匹配包括:将与相邻的参考词组中的匹配参考词语相匹配的匹配评价词语在所述评价子句中的词距与第二预定阈值进行比较;以及在所述词距大于所述第二预定阈值时,确定所述参考句式与所述评价子句不相匹配。9.根据权利要求7所述的方法,其特征在于,确定所述参考句式与所述评价子句不相匹配包括:判断所述评价子句中在与所述匹配参考词语相匹配的匹配评价词语之前是否具有否定词;如果具有否定词,则确定所述参考句式与所述评价子句不相匹配。10.根据权利要求7所述的方法,其特征在于,确定所述参考句式与所述评价子句不相匹配包括:在所述匹配参考词语是易混淆词时,判断与所述易混淆词相对应的混淆词是否出现在所述评价子句中与所述易混淆词语义关联的位置,所述易混淆词与所述混淆词之间具有所述语义关联的位置关系;如果所述混淆词出现在与所述易混淆词语...

【专利技术属性】
技术研发人员:乔志军李鑫王建华陈雪
申请(专利权)人:北京创鑫旅程网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1