一种结构化查询语句相似度检测方法、装置及设备制造方法及图纸

技术编号:40311109 阅读:18 留言:0更新日期:2024-02-07 20:54
本申请公开一种结构化查询语句相似度检测方法、装置及设备,获取第一结构化查询语句和第二结构化查询语句,构建对应的第一抽象语法树和第二抽象语法树。抽象语法树中的根节点与语句的查询结果的关联程度高于其他节点与语句的查询结果的关联程度。遍历第一抽象语法树中的节点,将遍历到的节点与第二抽象语法树中的同层级节点进行匹配,获取节点的匹配结果,该匹配结果表示第二抽象语法树中是否有同层级节点与第一抽象语法树中的节点相匹配。结合第一抽象语法树中的根节点的匹配结果、根节点的子节点的匹配结果和各自对应的权重,确定第一结构化查询语句和第二结构化查询语句的语句相似度。如此,无需配合数据库执行语句,检测成本较低。

【技术实现步骤摘要】

本申请涉及计算机,具体涉及一种结构化查询语句相似度检测方法、装置及设备


技术介绍

1、结构化查询语句相似度检测主要用于检测多个结构化查询语句所表达的语义是否相同。结构化查询语句相似度检测可应用于查询重写、语句重复性检测等场景。

2、目前,可直接执行多个结构化查询语句,获取每个结构化查询语句的查询结果,并通过判断多个查询结果是否一致来确定多个结构化查询语句的相似度。但是,结构化查询语句需要配合数据库才能执行。而在许多场景下,并不能提供数据库,或者若能提供数据库,数据库查询的成本可能较高,使得该检测方式的检测成本较高。


技术实现思路

1、有鉴于此,本申请提供一种结构化查询语句相似度检测方法、装置及设备,无需配合数据库执行结构化查询语句,使得该方法的检测成本较低。

2、为解决上述问题,本申请提供的技术方案如下:

3、第一方面,本申请提供一种结构化查询语句相似度检测方法,所述方法包括:

4、获取第一结构化查询语句和第二结构化查询语句,构建所述第一结构化查询语句的第一抽本文档来自技高网...

【技术保护点】

1.一种结构化查询语句相似度检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述遍历所述第一抽象语法树中的节点,将遍历到的所述第一抽象语法树中的节点与所述第二抽象语法树中的同层级节点进行匹配,获取所述第一抽象语法树中的节点的匹配结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据判断结果获取所述第一节点的匹配结果之后,所述当所述第二节点的数量为多个时,对多个所述第一节点的匹配结果进行比较,重新确定所述第一节点的匹配结果之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一节点的匹配...

【技术特征摘要】

1.一种结构化查询语句相似度检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述遍历所述第一抽象语法树中的节点,将遍历到的所述第一抽象语法树中的节点与所述第二抽象语法树中的同层级节点进行匹配,获取所述第一抽象语法树中的节点的匹配结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据判断结果获取所述第一节点的匹配结果之后,所述当所述第二节点的数量为多个时,对多个所述第一节点的匹配结果进行比较,重新确定所述第一节点的匹配结果之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一节点的匹配结果、所述第一节点的匹配结果对应的权重、所述第一子节点的匹配结果、所述第一节点的子节点匹配结果对应的权重,重新确定所述第一节点的匹配结果,包括:

5.根据权利要求2所述的方法,其特征在于,所述属性值匹配规则为所述第一节点和所述第二节点的节点属性值相同或第一节点和所述第二节点...

【专利技术属性】
技术研发人员:史群东詹怡李爽尹小明孙阳谢佳君孙科
申请(专利权)人:北京火山引擎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1