【技术实现步骤摘要】
一种基于虚假正样本检测的弱监督语义解析方法
本专利技术属于语义解析
,更具体地,涉及一种基于虚假正样本检测的弱监督语义解析方法。
技术介绍
语义解析问题即将给定的自然语言转换为某种形式化描述的问题。形式化的描述可以是基于某种语法的表达式,如λ-算子表达式等,也可以是某种树或图结构,例如语义解析树等,也可以是程序语言,如SQL、PYTHON等。通常的语义解析模型是通过训练样本采用有监督的方式学习得到,训练样本为{(xi,zi)},其中xi和zi分别是自然语言及其对应的形式化语义描述。近年来随着基于深度神经网络的自然语言处理方法的兴起,有监督的语义解析问题通常转化为sequence-to-sequence的翻译问题。弱监督语义解析问题的训练样本与有监督的语义解析问题的训练样本不同,该问题的训练样本是自然语言语料及其在某种执行环境下的结果,即{(xi,ci,yi)},其中xi是自然语言语料,ci和yi分别是对应的执行环境和结果,即假设xi的语义表示为zi,将zi在环境ci中执行得到yi,即ci(zi)=yi。 ...
【技术保护点】
1.一种基于虚假正样本检测的弱监督语义解析方法,其特征在于,包括:/n(1)采用随机梯度下降的方法训练语料的形式化表示模型p
【技术特征摘要】
1.一种基于虚假正样本检测的弱监督语义解析方法,其特征在于,包括:
(1)采用随机梯度下降的方法训练语料的形式化表示模型pθ(z|xi),确定其中的参数θ,包括:
(1.1)随机取训练样本集S中的一个训练样本,记为(xi,ci,yi),其中xi是自然语言表示的语料,ci是xi的形式化表示zi的执行环境,yi是zi在ci中执行的结果;
(1.2)按照pθ(z|xi)采样多个可能的形式化表示{zi,k};
(1.3)计算采样到的xi的形式化表示{zi,k}的回报的均值,作为xi的形式化表示的期望回报Gθ(xi,yi);
(1.4)计算语料xi的回报一致性度量ki;
(1.5)根据上述(xi,ci,yi)、{zi,k}、Gθ(xi,yi)和ki计算目标函数梯度
(1.6)利用上述目标函数梯度更新参数θ;
(1.7)如果目标函数收敛结束训练,否则回到步骤(1.1);
(2)利用所述训练好的形式化表示模型pθ(z|xi)对待形式化表示的自然语言进行形式化语义描述。
2.如权利要求1所述的基于虚假正样本检测的弱监督语义解析方法,其特征在于,所述步骤(1.7)中的目标函数为:
3.如权利要求1或2所述的基于虚假正样本检测的弱监督语义解析方法,其特征在于,所述步骤(1.3)中的Gθ(xi,yi)是以θ为参数的随机策略pθ(z|xi)生成xi的形式化表示的回报期望:R(z)是z在环境c中执行的回报,P为所有可能的形式化表示的集合,z∈P是其中一个可能的形式化表示。
4.如权利要求3所述的基于虚假正样本检测的弱监督语义...
【专利技术属性】
技术研发人员:刘俊涛,张毅,王振杰,王军伟,高子文,王军利,周莹,杨向广,
申请(专利权)人:中国船舶重工集团公司第七零九研究所,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。