一种段落的语义信息处理方法、装置及存储介质制造方法及图纸

技术编号：34480662 阅读：17 留言：0更新日期：2022-08-10 08:56

本发明专利技术涉及一种段落的语义信息处理方法、装置及存储介质，属于语义信息处理技术领域；方法包括：导入原始段落、语义逻辑切割模型和语义理解及表达模型；将原始段落输入语义逻辑切割模型中进行逻辑切割，得到原始段落的逻辑切割跨度信息；将原始段落的逻辑切割跨度信息输入语义理解及表达模型中进行语义处理，得到原始段落的逻辑切割跨度信息的语义信息；将逻辑切割跨度信息的语义信息添加到原始段落中，得到完整段落；根据语义逻辑切割模型和语义理解及表达模型对完整段落进行更新迭代处理，得到最终的语义信息。本发明专利技术能够得到准确而全面的段落语义信息，且通过关注段落上下文的逻辑界线来提高段落语义理解和表达的准确性。界线来提高段落语义理解和表达的准确性。界线来提高段落语义理解和表达的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种段落的语义信息处理方法、装置及存储介质

[0001]本专利技术主要涉及语义信息处理
，具体涉及一种段落的语义信息处理方法、装置及存储介质。

技术介绍

[0002]语义理解和表达是自然语言处理中的热点研究问题。语义理解是将文本转变为计算机能够阅读的结构化数据，并使机器理解在特定场景下文本表示的语义及意图等，从其中提取信息进而实现完成相应的下游任务的方法。语义表达是将文本映射到机器可解释的含义表示的任务。基于不同尺度的语义理解和表达的框架可以对语言进行不同精准程度的解读和表达，而对动态情景的语义理解与表达的方法研究的建立是构建这种具有弹性的准确且全面理解和表示语义的有效途径。初始阶段对语义理解和表达分别采用传统的语言模型n
‑
gram统计模型和采用基于语义的组合性原理。N
‑
gram统计模型存在只能计算前n
‑
1个词缺乏长期依赖且随着n增加模型参数也增长等问题。基于组合原理的语义表达模型严重依赖手工制作的语法、词典和特征。
[0003]其次，在语义表示方面采用基于神经网络的解析器表示语义。例如，研究者提出数据重组方法，该方法将先验知识输入RNN模型进而提升模型的性能。在2018年，科研工作者设计结构感知神经架构，该架构将语义表示分为两个阶段。在2019年，科研工作者利用图神经网络架构在解析过程中合并有关实体及其关系信息。然而，由于这类方法缺少捕获话语中的组合结构而导致神经语义解析模型具有较差的泛化能力。

技术实现思路

[0004]本专...

【技术保护点】

【技术特征摘要】
1.一种段落的语义信息处理方法，其特征在于，包括如下步骤：导入原始段落、语义逻辑切割模型和语义理解及表达模型；将所述原始段落输入所述语义逻辑切割模型中进行逻辑切割，得到所述原始段落的逻辑切割跨度信息；将所述原始段落的逻辑切割跨度信息输入所述语义理解及表达模型中进行语义处理，得到所述原始段落的逻辑切割跨度信息的语义信息；将所述逻辑切割跨度信息的语义信息添加到所述原始段落中，得到完整段落；根据所述语义逻辑切割模型和所述语义理解及表达模型对所述完整段落进行更新迭代处理，得到最终的语义信息。2.根据权利要求1所述的语义信息处理方法，其特征在于，所述进行逻辑切割前还包括训练所述语义逻辑切割模型的步骤，具体为：将训练段落导入所述语义理解及表达模型中进行解码，得到语义信息，并根据注意力机制挑选语义信息中的多个关键语义信息，并通过概率计算表达式计算多个所述关键语义信息的条件概率，通过所述条件概率得到与多个所述关键语义信息对应的逻辑切割跨度内容，将各个逻辑切割跨度内容分别作为训练标签；将所有的训练标签输入所述语义逻辑切割模型中，并通过伪监督训练方法训练输入训练标签后的语义逻辑切割模型；所述概率计算表达式为：L＝LOG
logic
(x)，p(i|x)＝softmax
i
(LW
LI
)，)，)，)，其中，L表示编码器编码的隐藏层信息，LOG
logic
表示基于神经网络的段落逻辑分割模型，p(i|θ
(i)
)表示输入信息逻辑界线起始位置的条件概率，p(j|θ
(j)
)表示输入信息逻辑界线终点位置的条件概率，ln(.)表示ln函数，W
LI
和W
LJ
分别表示逻辑界线起始位置和终点位置的权重矩阵，i表示输入信息逻辑界线起始位置，j表示输入信息逻辑界线终点位置，|.|表示绝对值函数，θ
i
和θ
j
分别表示输入信息与逻辑界线起始位置和终点位置的权重矩阵相乘的结果，l
k
、l
j
、w
j
和w
k
分别表示编码器编码的隐藏层信息和逻辑界线起始位置和终点位置的权重矩阵的分量。3.根据权利要求1所述的语义信息处理方法，其特征在于，所述将所述原始段落输入所述语义逻辑切割模型中进行逻辑切割，得到所述原始段落的逻辑切割跨度信息，具体为：将所述原始段落输入所述语义逻辑切割模型中，通过所述语义逻辑切割模型计算待分割内容在整个原始段落中的语义分配概率，并根据所述语义分配概率得到最能够表达待分割内容完整语义的位置，并将所述位置设置为逻辑切割点，并将原始段落的初始位置到所
述逻辑切割点的距离设置为逻辑切割跨度，并通过逻辑切割表达式表示所述逻辑切割跨度中的信息，所述逻辑切割表达式为：其中，x
(k+1)
表示k+1次迭代后的逻辑切割跨度信息，表示逻辑切割跨度中的信息，表示逻辑切割跨度中的信息，表示k次迭代后的逻辑切割跨度信息，i和j分别表示本次逻辑跨度的初始位置和终止位置，x
k
表示k次迭代后的逻辑切割跨度信息，表示逻辑切割跨度中的语义表示，表示对逻辑切割跨度中的语义表示的理解和表达，表示一种映射关系。4.根据权利要求3所述的语义信息处理方法，其特征在于，所述将所述原始段落的逻辑切割跨度信息输入所述语义理解及表达模型中进行语义处理，得到所述原始段落的逻辑切割跨度信息的语义信息，具体为：将所述逻辑切割跨度信息输入所述语义理解及表达模型中，通过所述语义理解及表达模型中的编解码对所述逻辑切割跨度信息进行语义处理，得到所述逻辑切割跨度信息的语义信息，所述编解码为：dec＝Attn
‑
Bi
‑
GRU
dec
(enc)，其中，enc表示所述语义理解及表达模型中编码器编码的隐藏层信息，enc＝Bi
‑
GRU
enc
(s)，Bi<...

【专利技术属性】
技术研发人员：蔡晓东，蒋鹏，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人