语义关联分析模型的生成方法及语义关联分析方法技术

技术编号:39253659 阅读:7 留言:0更新日期:2023-10-30 12:05
本公开关于一种语义关联分析模型的生成方法及语义关联分析方法,该方法包括:获取多个历史查询信息和每个历史查询信息对应的查询频率;根据查询频率,对多个历史查询信息进行分类处理,得到多个查询类型各自对应的查询信息集合;基于任一查询信息集合对应的查询类型,对任一查询信息集合进行关联分析,得到任一查询信息集合对应的至少一个历史查询信息对以及任一历史查询信息对对应的关联标签信息;基于至少一个历史查询信息对和关联标签信息,对预设语义关联分析模型进行训练,得到目标语义关联分析模型。利用本公开实施例可以极大的减少标注成本,保证多种查询类型下的训练数据的充足,进而提高目标语义关联分析模型的语义关联分析的准确性。语义关联分析的准确性。语义关联分析的准确性。

【技术实现步骤摘要】
语义关联分析模型的生成方法及语义关联分析方法


[0001]本公开涉及人工智能
,尤其涉及一种语义关联分析模型的生成方法及语义关联分析方法。

技术介绍

[0002]移动搜索引擎作为用户从互联网和各类UGC(User

generated Content,用户生产内容)中获取感兴趣信息的工具,已经越来越普及。由于在手机等移动设备上文字输入成本较高、很多类似的UGC内容文本表达多样,所以如果用户在使用移动搜索时通常输入的查询信息存在词不达意或跟想要找的目标点击对象存在一定的语意偏差时,引擎可能就不能有效返回用户想要的目标点击对象,导致用户搜索满意度降低。一般搜索系统会引入一些自动改写推荐的查询信息,为了保证改写推荐的查询信息和原用户输入查询信息之间具有较高的语义相关性,不至于严重漂移。现有技术往往会采用基于语言表示模型对查询信息组合进行编码处理,进而根据事先标注的是否相关的查询信息组合样本,训练语义关联分析模型。但是,现有的模型训练过程中,存在人工标注数据不足、训练数据类别较为单一等问题,导致语义关联分析模型的语义关联分析准确度不足。

技术实现思路

[0003]有鉴于上述存在的技术问题,本公开提出了一种语义关联分析模型的生成方法及语义关联分析方法。
[0004]根据本公开实施例的一方面,提供一种语义关联分析模型的生成方法,包括:
[0005]获取多个历史查询信息和每个历史查询信息对应的查询频率;
[0006]根据所述查询频率,对所述多个历史查询信息进行分类处理,得到多个查询类型各自对应的查询信息集合;
[0007]基于任一查询信息集合对应的查询类型,对所述任一查询信息集合进行关联分析,得到所述任一查询信息集合对应的至少一个历史查询信息对以及任一历史查询信息对对应的关联标签信息;所述关联标签信息表征所述任一历史查询信息对中两个历史查询信息的关联程度;
[0008]基于所述至少一个历史查询信息对和所述关联标签信息,对预设语义关联分析模型进行训练,得到目标语义关联分析模型。
[0009]根据本公开实施例的另一方面,提供一种语义关联分析方法,包括:
[0010]获取待分析查询信息,所述待分析查询信息包括第三查询信息和第四查询信息;
[0011]将所述第三查询信息和所述第四查询信息输入至目标语义关联分析模型进行语义关联分析,得到关联分析结果;
[0012]其中,所述目标语义关联分析模型为基于上述语义关联分析模型的生成方法得到的。
[0013]根据本公开实施例的另一方面,提供一种语义关联分析模型的生成装置,包括:
[0014]第一信息获取模块,用于获取多个历史查询信息和每个历史查询信息对应的查询频率;
[0015]分类处理模块,用于根据所述查询频率,对所述多个历史查询信息进行分类处理,得到多个查询类型各自对应的查询信息集合;
[0016]关联分析模块,用于基于任一查询信息集合对应的查询类型,对所述任一查询信息集合进行关联分析,得到所述任一查询信息集合对应的至少一个历史查询信息对以及任一历史查询信息对对应的关联标签信息;所述关联标签信息表征所述任一历史查询信息对中两个历史查询信息的关联程度;
[0017]模型训练模块,用于基于所述至少一个历史查询信息对和所述关联标签信息,对预设语义关联分析模型进行训练,得到目标语义关联分析模型。
[0018]根据本公开实施例的另一方面,提供一种语义关联分析装置,包括:
[0019]第二信息获取模块,用于获取待分析查询信息,所述待分析查询信息包括第三查询信息和第四查询信息;
[0020]语义关联分析模块,用于将所述第三查询信息和所述第四查询信息输入至目标语义关联分析模型进行语义关联分析,得到关联分析结果;其中,所述目标语义关联分析模型为基于上述语义关联分析模型的生成方法得到的。
[0021]根据本公开实施例的另一方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述语义关联分析模型的生成方法或上述语义关联分析方法。
[0022]根据本公开实施例的另一方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述语义关联分析模型的生成方法或上述语义关联分析方法。
[0023]根据本公开实施例的另一方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述语义关联分析模型的生成方法或上述语义关联分析方法。
[0024]本公开的实施例提供的技术方案至少带来以下有益效果:
[0025]通过获取多个历史查询信息和每个历史查询信息对应的查询频率,根据查询频率,对多个历史查询信息进行分类处理,得到多个查询类型各自对应的查询信息集合,可以实现按照查询频率对历史查询信息的分类,再结合任一查询信息集合对应的查询类型,对任一查询信息集合进行关联分析,得到任一查询信息集合对应的至少一个历史查询信息对以及任一历史查询信息对对应的关联标签信息,可以实现不同的查询频率的训练数据的构造,极大的减少标注成本,保证多种查询类型下的训练数据的充足,且在多个历史查询信息的基础上,得到的关联标签信息可以比人工标注的更能反映用户真实意图,接着,结合至少一个历史查询信息对和关联标签信息,对预设语义关联分析模型进行训练,得到目标语义关联分析模型,可以提高目标语义关联分析模型的语义关联分析的准确性。
[0026]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0027]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
[0028]图1是根据一示例性实施例示出的一种应用系统的示意图;
[0029]图2是根据一示例性实施例示出的一种语义关联分析模型的生成方法的流程图;
[0030]图3是根据一示例性实施例示出的一种目标语义关联分析模型的模型示意图;
[0031]图4是根据一示例性实施例示出的一种搜索平台的搜索页面示意图;
[0032]图5是根据一示例性实施例示出的另一种搜索平台的搜索页面示意图;
[0033]图6是根据一示例性实施例示出的一种语义关联分析模型的生成装置的框图;
[0034]图7是根据一示例性实施例示出的一种用于生成目标语义关联分析模型,或对待分析查询信息进行语义关联分析的电子设备的框图;
[0035]图8是根据一示例性实施例示出的另一种用于生成目标语义关联分析模型,或对待分析查询信息进行语义关联分析的电子设备的框图。
具体实施方式
[0036]以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义关联分析模型的生成方法,其特征在于,所述方法包括:获取多个历史查询信息和每个历史查询信息对应的查询频率;根据所述查询频率,对所述多个历史查询信息进行分类处理,得到多个查询类型各自对应的查询信息集合;基于任一查询信息集合对应的查询类型,对所述任一查询信息集合进行关联分析,得到所述任一查询信息集合对应的至少一个历史查询信息对以及任一历史查询信息对对应的关联标签信息;所述关联标签信息表征所述任一历史查询信息对中两个历史查询信息的关联程度;基于所述至少一个历史查询信息对和所述关联标签信息,对预设语义关联分析模型进行训练,得到目标语义关联分析模型。2.根据权利要求1所述的方法,其特征在于,所述查询类型包括第一频率类型、第二频率类型和第三频率类型,所述第一频率类型对应的查询频率大于所述第二频率类型对应的查询频率,所述第二频率类型对应的查询频率大于所述第三频率类型对应的查询频率,所述至少一个历史查询信息对包括所述第一频率类型对应的至少一个第一查询信息对、所述第二频率类型对应的至少一个第二查询信息对,以及所述第三频率类型对应的至少一个第三查询信息对;所述方法还包括:获取所述每个历史查询信息对应的查询点击结果集合;所述基于任一查询信息集合对应的查询类型,对所述任一查询信息集合进行关联分析,得到多个历史查询信息对以及任一历史查询信息对对应的关联标签信息,包括:在所述查询类型为所述第一频率类型的情况下,基于所述第一频率类型对应的查询信息集合中每个历史查询信息对应的查询点击结果集合,对所述第一频率类型对应的查询信息集合进行关联分析,得到所述至少一个第一查询信息对以及任一第一查询信息对对应的关联标签信息;所述任一第一查询信息对包括对应的查询点击结果集合存在相同的查询点击结果的两个历史查询信息;在所述查询类型为所述第二频率类型的情况下,基于所述第二频率类型对应的查询信息集合中每个历史查询信息对应的查询点击结果集合,对所述第二频率类型对应的查询信息集合进行关联分析,得到所述至少一个第二查询信息对以及任一第二查询信息对对应的关联标签信息;所述任一第二查询信息对包括对应的查询点击结果集合存在相同的查询点击结果的两个历史查询信息;在所述查询类型为所述第三频率类型的情况下,对所述第三频率类型对应的查询信息集合中每个历史查询信息进行扩充关联分析,得到所述至少一个第三查询信息对以及任一第三查询信息对对应的关联标签信息。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一频率类型对应的查询信息集合中每个历史查询信息对应的查询点击结果集合,对所述第一频率类型对应的查询信息集合进行关联分析,得到所述至少一个第一查询信息对以及任一第一查询信息对对应的关联标签信息,包括:基于所述第一频率类型对应的查询信息集合中每个历史查询信息对应的查询点击结果集合,对所述第一频率类型对应的查询信息集合进行结果关联分析,得到所述至少一个第一查询信息对以及所述任一第一查询信息对对应的点击结果组合信息;
基于所述任一第一查询信息对对应的查询频率和所述任一第一查询信息对对应的点击结果组合信息,对所述任一第一查询信息对进行集合关联分析,得到所述任一第一查询信息对对应的关联标签信息。4.根据权利要求3所述的方法,其特征在于,所述基于所述任一第一查询信息对对应的查询频率和所述任一第一查询信息对对应的点击结果组合信息,对所述任一第一查询信息对进行集合关联分析,得到所述任一第一查询信息对对应的关联标签信息,包括:从所述任一第一查询信息对对应的查询频率中,确定所述任一第一查询信息对对应的目标查询频率;所述目标查询频率为所述任一第一查询信息对对应的查询频率中最大的查询频率;基于所述任一第一查询信息对对应的点击结果组合信息,确定所述任一第一查询信息对中两个历史查询信息各自对应的点击操作数量;从所述点击操作数量中,确定所述任一第一查询信息对对应的目标点击操作数量,所述目标点击操作数量为所述点击操作数量中最小的点击操作数量;基于所述目标查询频率和所述目标点击操作数量,对所述任一第一查询信息对进行关联程度分析,得到所述任一第一查询信息对对应的关联标签信息。5.根据权利要求2所述的方法,其特征在于,所述基于所述第二频率类型对应的查询信息集合中每个历史查询信息对应的查询点击结果集合,对所述第二频率类型对应的查询信息集合进行关联分析,得到所述至少一个第二查询信息对以及任一第二查询信息对对应的关联标签信息,包括:基于所述第二频率类型对应的查询信息集合中每个历史查询信息对应的查询点击结果集合,对所述第二频率类型对应的查询信息集合进行...

【专利技术属性】
技术研发人员:康战辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1