【技术实现步骤摘要】
句子语义匹配方法、系统、存储介质和电子设备
[0001]本专利技术涉及句子语义匹配
,具体涉及一种句子语义匹配方法、系统、存储介质和电子设备。
技术介绍
[0002]句子语义匹配,即识别两个句子之间的语义关系,是自然语言处理的基础任务之一,在很多的自然语言处理任务中都有着重要体现。
[0003]目前,句子语义匹配技术主要包括两种:第一种为基于句子文本,主要形式为通过不同类型的神经网络结构编码句子语义以及进行语义匹配的度量。第二种为基于句子文本和标签编码,主要形式为不仅对句子文本进行处理,同时通过不同的方法编码整个标签集合,通过显式分析输入句子和标签之间的关系进行最终的语义关系分类。例如输入句子和标签联合建模,利用便签的编码影响整个句子的编码,从而保证生成的句子语义表示向量与标签的编码在同一空间,最终保证了更好的分类;再如多任务学习方法中通过将每个任务的标签都映射为一个向量表示,在训练了几个相关任务之后,针对新的任务,能够直接使用之前得到的结果。
[0004]但是,上述两种句子语义匹配技术均没有充分利用输 ...
【技术保护点】
【技术特征摘要】
1.一种句子语义匹配方法,其特征在于,包括:S1、预处理待分析句子对,获取待分析句子对的向量表示;S2、将所述向量表示输入预先训练的语义关系模型,获取待分析句子对语义匹配关系的概率;S3、将所述概率作为待分析句子对语义关系的预测结果。2.如权利要求1所述的句子语义匹配方法,其特征在于,所述步骤S2具体包括:S21、将所述向量表示输入预先训练的语义关系模型,获取待分析句子对的全局语义向量表示和局部语义向量表示;S22、拼合所述全局语义向量表示和局部语义向量表示,获取待分析句子对的语义关系向量表示;S23、根据所述语义关系向量表示,采用深度学习方法,获取待分析句子对语义匹配关系的概率。3.如权利要求2所述的句子语义匹配方法,其特征在于,所述语义关系模型的构建包括:预处理多个句子对,获取所述多个句子对相应的向量表示;根据所述向量表示,获取所述多个句子对的全局语义向量表示和局部语义向量表示;拼合每个句子对的全局语义向量表示和局部语义向量表示,获取对应的语义关系向量表示;根据任意单个句子对的语义关系向量表示,采用深度学习方法,获取该单个句子对语义匹配关系的概率;根据任意两个句子对的语义关系向量表示,分析该两个句子对的关系;根据三个句子对的语义关系向量表示,采用距离计算函数,分别计算锚点句子对与其他两个句子对的相似性,所述三个句子对包括锚点句子对、正例句子对和反例句子对;根据任意单个句子对语义匹配关系的概率、任意两个句子对的关系以及锚点句子对与其他两个句子对的相似性构建所述语义关系模型。4.如权利要求3所述的句子语义匹配方法,其特征在于,所述语义关系模型的损失函数L为:其中,N表示为整个训练数据中的样本组数;β表示为不同优化目标的权重系数;j表示第j组训练数据;表示为任意单个句子对的语义关系预测优化目标:其中,i表示第i个样本;y
i
表示模型预测的单个句子对的语义关系,表示单个句子对的真实语义关系;表示句子a的向量表示;表示句子b的向量表示;表示预测单个句子对语义匹配关系的概率;
表示任意两个句子对的关系预测优化目标:其中,表示模型预测的两个句子对的关系,表示两个句子对的真实关系;表示第i组任意两个句子对;表示任意两个句子对的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。