标签扩充方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:22075780 阅读:31 留言:0更新日期:2019-09-12 14:10
本发明专利技术公开了标签扩充方法、装置、计算机设备及存储介质,其中方法可包括:针对包含已有标签的第一查询,从日志记录的历史查询中筛选出第一查询的相似查询;通过依存关系分析,对相似查询进行标签抽取;将抽取出的非已有标签作为扩充出的标签。应用本发明专利技术所述方案,能够提高处理结果的准确性及效率等。

Label Extension Method, Device, Computer Equipment and Storage Media

【技术实现步骤摘要】
标签扩充方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用技术,特别涉及标签扩充方法、装置、计算机设备及存储介质。
技术介绍
标签(tag)是描述实体特征的属性,一般用于满足泛需求问答。比如,“描写春天的句子”,其中的“春天”即为一个tag,也可以是短语形式,如“适合发朋友圈的说说”,其中的“适合发朋友圈”即为一个tag。目前的影视泛需求问答、汉语句子泛需求问答以及人物泛需求问答等产品大多数都是基于tag进行召回,相应地,扩充tag体系,可丰富展现结果。比如,影视泛需求问答中,用户输入的查询(query)为“爱情电影”,其中的“爱情”为tag,可召回相关的电影,并可将tag体系中与“爱情”语义相似的“言情”或“恋爱”电影也作为召回结果返回,但如果tag体系中不存在“言情”或“恋爱”这些tag,则无法召回相关的电影。为了扩充/丰富tag体系,通常采用以下方式:基于模式(pattern)规则从日志记录的query中获取对应的tag,如人工配置“描写***的句子”的pattern,相应地,可从日志中记录的query中获取到“***”,如最终获取到“春天”、“天空”等。但上述本文档来自技高网...

【技术保护点】
1.一种标签扩充方法,其特征在于,包括:针对包含已有标签的第一查询,从日志记录的历史查询中筛选出所述第一查询的相似查询;通过依存关系分析,对所述相似查询进行标签抽取;将抽取出的非已有标签作为扩充出的标签。

【技术特征摘要】
1.一种标签扩充方法,其特征在于,包括:针对包含已有标签的第一查询,从日志记录的历史查询中筛选出所述第一查询的相似查询;通过依存关系分析,对所述相似查询进行标签抽取;将抽取出的非已有标签作为扩充出的标签。2.根据权利要求1所述的方法,其特征在于,所述从日志记录的历史查询中筛选出所述第一查询的相似查询包括:根据所述日志获取所述第一查询对应的展现结果的统一资源定位符URL列表;针对任一历史查询,根据所述日志获取所述历史查询对应的展现结果的URL列表;比较所述历史查询对应的URL列表与所述第一查询对应的URL列表,根据比较结果确定所述历史查询是否为所述第一查询的相似查询。3.根据权利要求2所述的方法,其特征在于,所述根据比较结果确定所述历史查询是否为所述第一查询的相似查询包括:若所述历史查询对应的URL列表与所述第一查询对应的URL列表中的重复URL数大于预先设定的第一阈值,则将所述历史查询确定为所述第一查询的相似查询。4.根据权利要求1所述的方法,其特征在于,所述通过依存关系分析,对所述相似查询进行标签抽取包括:针对任一相似查询,确定出所述相似查询中的中心词;从所述相似查询中抽取出用于修饰所述中心词且符合词性要求的词或短语,作为抽取出的标签。5.根据权利要求4所述的方法,其特征在于,该方法进一步包括:从筛选出的相似查询中过滤掉中心词不在最后位置的相似查询,对保留下的相似查询进行标签抽取。6.根据权利要求1所述的方法,其特征在于,该方法进一步包括:对于任一标签,在针对包含所述标签的查询进行召回时,根据主需求词典确定所述查询的召回需求,按照所述召回需求进行召回。7.一种标签扩充装置,其特征在于,包括:获取单元以及抽取单元;所述获取单元,用于针对包含已有标签的第一查询,从日志记录的历史...

【专利技术属性】
技术研发人员:杨晨杨天行
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1