【技术实现步骤摘要】
实体查询方法、查询端、请求端和电子设备
[0001]本申请实施例涉及自然语言处理领域中的信息查询领域,并且更具体地,涉及实体查询方法、查询端、请求端和电子设备。
技术介绍
[0002]自然语言到结构化查询语言(Natural Language to SQL,NL2SQL)技术用于:将自然语言问题转换为结构化查询语言(Structured Query Language,SQL)语言问题。通常情况下,将直接拼接的上下文问题(query)作为NL2SQL模型的输入,NL2SQL模型的输出即为SQL语言问题。
[0003]但是,直接拼接的上下文问题作为NL2SQL模型的输入时,期望每一轮用户提问都是明确且有答案的,下一轮用户继续追问其他信息,这种情况是比较理想化的,如果用户有表达错误或者用户的首次问询提供的信息不完整就会使得查询结果为不存在答案或信息错误冗余;此外,由于用户多轮提问中往往携带噪音,因此很难改写出信息完整正确的句子,降低了查询的查询准确度。
技术实现思路
[0004]本申请提供了一种实体查询方法、查询端、请求端和电子设备,能够提升实体查询的准确度。
[0005]第一方面,本申请提供了一种实体查询方法,包括:
[0006]接收请求端发送的自然语言查询语句;该自然语言查询语句用于在第一维度实体下请求查询第一内容实体,该第一内容实体用于表征待查询信息,该第一维度实体用于表征该第一内容实体所在的维度;
[0007]向该请求端发送追问语句;该追问语句用于在第二维度实体下追问 ...
【技术保护点】
【技术特征摘要】
1.一种实体查询方法,其特征在于,包括:接收请求端发送的自然语言查询语句;所述自然语言查询语句用于在第一维度实体下请求查询第一内容实体,所述第一内容实体用于表征待查询信息,所述第一维度实体用于表征所述第一内容实体所在的维度;向所述请求端发送追问语句;所述追问语句用于在第二维度实体下追问用于约束所述第一内容实体的内容实体,所述第二维度实体表征的维度不同于所述第一维度实体表征的维度;接收所述请求端发送的追问回复语句;基于所述自然语言查询语句、所述追问语句以及所述追问回复语句,对所述自然语言查询语句进行改写,得到改写查询语句;将所述改写查询语句转换为结构化查询语言SQL语句;基于所述SQL语句,查询所述第一内容实体并向所述请求端发送查询回复语句,所述查询回复语句包括所述第一内容实体。2.根据权利要求1所述的方法,其特征在于,所述向所述请求端发送追问语句,包括:对所述自然语言查询语句进行分析,确定数据表;所述数据表包括用于表征至少一个维度的维度实体和所述至少一个维度实体中各个维度实体的实体库;基于所述数据表创建对话树;所述对话树为至少一个槽位形成的树结构,所述至少一个槽位包括与所述至少一个维度实体除所述第一维度实体之外的各个维度实体对应的槽位;若所述至少一个槽位中的当前槽位关联的触发条件指示:所述当前槽位为必填槽位,则向所述请求端发送第一语句,并基于所述第一语句的第一回复语句填充所述当前槽位,直至所述至少一个槽位中触发条件指示填充内容实体的槽位均填充有内容实体;其中,所述第一语句用于在所述当前槽位对应的维度实体下追问所述当前槽位填充的内容实体,所述追问语句包括所述第一语句。3.根据权利要求2所述的方法,其特征在于,所述直至所述至少一个槽位中触发条件指示填充内容实体的槽位均填充有内容实体,包括:若所述当前维度实体对应的实体库中包括所述第一回复语句指示的内容实体,则将所述第一回复语句指示的内容实体填充至所述当前槽位,并继续遍历所述当前槽位的下一槽位,直至所述至少一个槽位中触发条件指示填充内容实体的槽位均填充有内容实体。4.根据权利要求2所述的方法,其特征在于,所述直至所述至少一个槽位中触发条件指示填充内容实体的槽位均填充有内容实体,包括:若所述当前维度实体对应的实体库中不包括所述第一回复语句指示的内容实体,则计算所述当前维度实体对应的实体库中各个内容实体与所述第一回复语句指示的内容实体之间的相似度,并按照相似度由大到小的顺序对所述当前维度实体对应的实体库中的内容实体进行排序,得到所述当前维度实体对应的实体库中内容实体的排列顺序;向所述请求端发送澄清消息,所述澄清消息包括所述排列顺序中排序靠前的至少一个内容实体;接收所述请求端发送的确认消息,所述确认消息用于指示所述至少一个内容实体中确认的内容实体;
将所述确认的内容实体填充至所述当前槽位,并继续遍历所述当前槽位的下一槽位,直至所述至少一个槽位中触发条件指示填充内容实体的槽位均填充有内容实体。5.根据权利要求2所述的方法,其特征在于,所述向所述请求端发送追问语句之前,所述方法还包括:对所述自然语言查询语句进行分析,得到用于在第三维度实体下约束所述第一内容实体的第二内容实体;将所述第二内容实体填充至所述至少一个槽位中与所述第三维度实体对应的槽位。6.根据权利要求1所述的方法,其特征在于,所述基于所述自然语言查询语句、所述追问语句以及所述追问回复语句,对所述自然语言查询语句进行改写,得到改写查询语句,包括:基于所述自然语言查询语句、所述追问语句以及所述追问回复语句,确定输入序列;以所述输入序列为输入,利用基于序列到序列Seq2Seq结构的改写模型得到输出序列;将所述输出序列确定为所述改写查询语句。7.根据权利要求1所述的方法,其特征在于,所述基于所述自然语言查询语句、所述追问语句以及所述追问回复语句,对所述自然语言查询语句进行改写,得到改写查询语句,包括:对所述自然语言查询语句、所述追问语句以及所述追问回复语句进行关键字提取,得到多个关键词;对所述多个关键词进行拼接,得到所述改写查询语句。8.根据权利要求1所述的方法,其特征在于,所述将所述改写查询语句转换为结构化查询语言SQL语句,包括:对所述改写查询语句和至少一个维度实体进行编码,得到起始标记符号的表征向量、所述改写查询语句中各个词的表征向量、所述至少一个维度实体中各个维度实体中各个词的表征向量、以及终止标记符号的表征向量;所述至少一个维度实体包括查询所述第一内容实体使用的数据表中用于表征至少一个维度的维度实体;基于所述起始标记符号的表征向量,预测第一数量和第二数量;所述第一数量表示所述SQL语句中选择子句的数量,所述第二数量表示所述SQL语句中条件子句的数量;对所述各个维度实体中各个词的表征向量进行融合,得到所述各个维度实体的表征向量;基于所述各个维度实体的表征向量、所述第一数量以及所述第二数量,预测所述至少一个维度实体中用于构建所述选择子句的第四维度实体和所述至少一个维度实...
【专利技术属性】
技术研发人员:张倩汶,饶孟良,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。