一种基于虚假正样本检测的弱监督语义解析方法技术

技术编号:26792149 阅读:46 留言:0更新日期:2020-12-22 17:07
为了解决弱监督语义解析问题,本发明专利技术提供了一种基于虚假正样本检测的弱监督语义解析方法。该方法用于将自然语言描述的操作转换为形式化的语义描述,例如将自然语言描述的数据检索要求转换为SQL语句在数据库管理系统中最执行并返回检索结果。本发明专利技术提供的方法通过度量相似的训练样本的回报一致性来检测虚假正样本的存在,提出了包含回报一致性度量的目标函数,并采用随机梯度下降法优化此目标函数,进而得到语义解析模型。该方法提高了语义解析的准确度,具有较好的泛化能力。

【技术实现步骤摘要】
一种基于虚假正样本检测的弱监督语义解析方法
本专利技术属于语义解析
,更具体地,涉及一种基于虚假正样本检测的弱监督语义解析方法。
技术介绍
语义解析问题即将给定的自然语言转换为某种形式化描述的问题。形式化的描述可以是基于某种语法的表达式,如λ-算子表达式等,也可以是某种树或图结构,例如语义解析树等,也可以是程序语言,如SQL、PYTHON等。通常的语义解析模型是通过训练样本采用有监督的方式学习得到,训练样本为{(xi,zi)},其中xi和zi分别是自然语言及其对应的形式化语义描述。近年来随着基于深度神经网络的自然语言处理方法的兴起,有监督的语义解析问题通常转化为sequence-to-sequence的翻译问题。弱监督语义解析问题的训练样本与有监督的语义解析问题的训练样本不同,该问题的训练样本是自然语言语料及其在某种执行环境下的结果,即{(xi,ci,yi)},其中xi是自然语言语料,ci和yi分别是对应的执行环境和结果,即假设xi的语义表示为zi,将zi在环境ci中执行得到yi,即ci(zi)=yi。注意,xi的语义表示本文档来自技高网...

【技术保护点】
1.一种基于虚假正样本检测的弱监督语义解析方法,其特征在于,包括:/n(1)采用随机梯度下降的方法训练语料的形式化表示模型p

【技术特征摘要】
1.一种基于虚假正样本检测的弱监督语义解析方法,其特征在于,包括:
(1)采用随机梯度下降的方法训练语料的形式化表示模型pθ(z|xi),确定其中的参数θ,包括:
(1.1)随机取训练样本集S中的一个训练样本,记为(xi,ci,yi),其中xi是自然语言表示的语料,ci是xi的形式化表示zi的执行环境,yi是zi在ci中执行的结果;
(1.2)按照pθ(z|xi)采样多个可能的形式化表示{zi,k};
(1.3)计算采样到的xi的形式化表示{zi,k}的回报的均值,作为xi的形式化表示的期望回报Gθ(xi,yi);
(1.4)计算语料xi的回报一致性度量ki;
(1.5)根据上述(xi,ci,yi)、{zi,k}、Gθ(xi,yi)和ki计算目标函数梯度
(1.6)利用上述目标函数梯度更新参数θ;
(1.7)如果目标函数收敛结束训练,否则回到步骤(1.1);
(2)利用所述训练好的形式化表示模型pθ(z|xi)对待形式化表示的自然语言进行形式化语义描述。


2.如权利要求1所述的基于虚假正样本检测的弱监督语义解析方法,其特征在于,所述步骤(1.7)中的目标函数为:


3.如权利要求1或2所述的基于虚假正样本检测的弱监督语义解析方法,其特征在于,所述步骤(1.3)中的Gθ(xi,yi)是以θ为参数的随机策略pθ(z|xi)生成xi的形式化表示的回报期望:R(z)是z在环境c中执行的回报,P为所有可能的形式化表示的集合,z∈P是其中一个可能的形式化表示。


4.如权利要求3所述的基于虚假正样本检测的弱监督语义...

【专利技术属性】
技术研发人员:刘俊涛张毅王振杰王军伟高子文王军利周莹杨向广
申请(专利权)人:中国船舶重工集团公司第七零九研究所
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1