【技术实现步骤摘要】
基于对话改写模型的多轮文本到SQL方法及系统
[0001]本专利技术涉及智能语音领域,尤其涉及一种基于对话改写模型的多轮文本到SQL方法及系统。
技术介绍
[0002]随着使用自然语言(NL)查询数据库的高要求,文本到SQL已成为一个有趣的研究主题。标准大型数据库格式只能使用结构化查询语言(SQL)进行访问,这需要用户具备足够的数据库语言知识,从而降低了这些数据库的可访问性。
[0003]文本到SQL的任务极大地减小了这种用户对数据库语言知识掌握的差距,并允许基于NL的查询。先前有关“文本到SQL”的工作主要集中在单圈话语推断上,并根据与上下文无关的“文本到SQL”基准进行了评估。但是,实际上,用户通常需要多轮的Text
‑
to
‑
SQL系统进行交互,以明确解决其查询目的。
[0004]在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:
[0005]现有的端到端的多轮文本到SQL模型:依赖于大量标注的多轮文本到SQL的数据,然而多轮文本到SQL的数据 ...
【技术保护点】
【技术特征摘要】
1.一种对话改写模型的训练方法,包括:使用预训练的BART作为对话改写模型的改写器和简化器,其中,所述改写器和简化器都分别有各自对应的奖励函数,以用于评估话语质量;基于无标注的多轮对话文本作为所述对话改写模型内改写器和简化器的联合训练的输入,生成了多种改写格式和简化格式;利用语义数据集评估所述改写格式的话语质量,修正所述改写器对应的奖励函数,确定第一奖励函数,利用多轮文本到SQL数据集评估所述简化格式的话语质量,修正所述简化器对应的奖励函数,确定第二奖励函数;基于所述第一奖励函数和所述第二奖励函数对所述改写器和简化器联合训练,得到训练后的对话改写模型。2.根据权利要求1所述的方法,其中,所述无标注的多轮对话文本的文本量为第一数量;所述语义数据集由第二数量有标注的多轮对话文本训练;所述多轮文本到SQL数据集由第二数量有标注的多轮对话文本训练;其中,所述第一数量小于第二数量。3.根据权利要求1所述的方法,其中,所述联合训练包括共训练以及对偶训练;所述基于所述第一奖励函数和所述第二奖励函数对所述改写器和简化器的对偶训练包括:基于所述第一奖励函数对所述改写器进行策略梯度训练,以使所述改写格式对应的SQL查询意图趋近于预设真实查询意图;基于所述第二奖励函数对所述简化器进行策略梯度训练,以使所述简化格式的语义趋近于预设原始文本语义。4.根据权利要求3所述的方法,其中,所述基于所述第一奖励函数和所述第二奖励函数对所述改写器和简化器的共训练包括:在所述基于所述第一奖励函数对所述改写器进行策略梯度训练之后,当所述改写格式的文本长度大于改写前的文本长度时,基于所述第一奖励函数对所述简化器进行最大似然估计训练;在所述基于所述第二奖励函数对所述简化器进行策略梯度训练之后,当所述简化格式的文本长度小于简化前的文本长度时,基于所述第二奖励函数对所述改写器进行最大似然估计训练。5.根据权利要求1所述的方法,其中,所述奖励函数包括:利用原始文本修正的令牌级奖励以及利用用户意图修正的句子级奖励。6.一种基于对话改写模型的多轮文本到SQL方法,包括:基于权利要求1所述的对话改写模型对多轮文本进行解耦,将所述多轮文本中的问题文本改写为包含语义的数据库查询问题文本...
【专利技术属性】
技术研发人员:俞凯,陈露,陈志,
申请(专利权)人:思必驰科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。