序列标注系统及序列标注模型的训练系统技术方案

技术编号:31450563 阅读:38 留言:0更新日期:2021-12-18 11:13
序列标注系统及序列标注模型的训练系统,序列标注系统包括:待处理数据获取模块适于获取待处理数据,所述待处理数据包括待处理语料;语义提取模块适于提取所述待处理数据的语义特征;逻辑运算模块适于将提取得到的语义特征和所述待处理数据进行逻辑运算,得到所述待处理数据的融合特征;概率计算模块适于根据所述待处理数据的融合特征,计算各候选预测标签标注序列的概率值;序列获取模块适于根据各候选预测标签标注序列的概率值,获取概率值符合预设的第一选取条件的候选预测标签标注序列,得到所述待处理数据的标签标注预测序列。采用上述方案,可以提高序列标注预测结果的准确率。率。率。

【技术实现步骤摘要】
序列标注系统及序列标注模型的训练系统


[0001]本说明书实施例涉及信息处理
,尤其涉及一种序列标注系统及序列标注模型的训练系统。

技术介绍

[0002]在互联网信息大爆炸的时代,计算机如果能够理解人类的语言,可以更好地辅助使用者获取有用信息。因此,自然语言处理(Natural Language Processing,NLP)成为了近年来的研究热点。
[0003]序列标注(Sequence Labeling)任务可以将语言序列转化为标注序列,由此作为许多自然语言处理任务的基础,是自然语言处理中的重要研究内容之一。
[0004]目前,现有的序列标注模型只能处理内容简单、来源单一的语言序列,在面对内容复杂或来源多变的语言序列时,往往泛化能力弱、通用性差,导致序列标注结果的准确率较低。

技术实现思路

[0005]有鉴于此,本说明书实施例提供了一种序列标注系统及序列标注模型的训练系统,能够提高序列标注预测结果的准确率。
[0006]本说明书实施例提供了一种序列标注系统,包括:
[0007]待处理数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种序列标注系统,其特征在于,包括:待处理数据获取模块,适于获取待处理数据,所述待处理数据包括待处理语料;语义提取模块,适于提取所述待处理数据的语义特征;逻辑运算模块,适于将提取得到的语义特征和所述待处理数据进行逻辑运算,得到所述待处理数据的融合特征;概率计算模块,适于根据所述待处理数据的融合特征,计算各候选预测标签标注序列的概率值,各候选预测标签标注序列包括:用于标注所述待处理语料的候选预测标签;序列获取模块,适于根据各候选预测标签标注序列的概率值,获取概率值符合预设的第一选取条件的候选预测标签标注序列,得到所述待处理数据的标签标注预测序列。2.根据权利要求1所述的序列标注系统,其特征在于,所述语义提取模块适于根据预设的各组特征提取参数,分别提取所述待处理数据的语义特征,得到各组的语义特征;所述逻辑运算模块适于对各组的语义特征和所述待处理数据进行逻辑运算,得到融合特征。3.根据权利要求2所述的序列标注系统,其特征在于,所述逻辑运算模块包括:权重分配子模块,适于将至少一组语义特征输入预设的非线性函数中进行非线性映射处理,并基于处理结果为其他组的语义特征和所述待处理数据分配权重系数;加权计算子模块,适于根据分配的权重系数,所述其他组的语义特征和所述待处理数据进行加权逻辑运算。4.根据权利要求1-3任一项所述的序列标注系统,其特征在于,还包括:位于逻辑运算模块和概率计算模块之间的迭代模块所述迭代模块,适于在确定满足预设的迭代条件后,获取本轮的融合特征,并提取所述融合特征的语义特征,以及将所述融合特征提取得到的语义特征和所述融合特征进行逻辑运算,得到迭代后的融合特征;在确定不满足所述迭代条件后,将迭代后的融合特征作为所述待处理数据的融合特征,用以确定各候选预测标签标注序列的概率值。5.根据权利要求1所述的序列标注系统,其特征在于,所述待处理数据获取模块还适于在所述提取所述待处理数据的语义特征之前,识别所述待处理语料中存在的属性信息,并获取所述属性信息对应的属性标签,得到属性标签序列,所述属性信息包括:所述待处理语料中各划分单元的位置信息、所述待处理语料的语法信息和所述待处理语料的分类信息中至少一种;所述序列标注系统还包括:数据组合模块,适于将所述待处理语料和属性标签序列进行组合处理,得到组合后的待处理数据,用以提取语义特征。6.根据权利要求5所述的序列标注系统,其特征在于,还包括:向量生成模块,适于...

【专利技术属性】
技术研发人员:沈大框张莹陈成才
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1