信息的识别方法、装置、存储介质和电子设备制造方法及图纸

技术编号:31980490 阅读:15 留言:0更新日期:2022-01-20 01:36
本公开涉及一种信息的识别方法、装置、存储介质和电子设备,涉及电子信息处理技术领域,该方法包括:获取目标对象的待识别信息,待识别信息用于表征目标对象的状态,待识别信息包括:按照预设顺序排列的多种状态数据。根据待识别信息中每种状态数据对应的表征向量,和该状态数据对应的位置向量,确定该状态数据对应的令牌,表征向量用于表征该状态数据,位置向量用于指示该状态数据在待识别信息中的顺序。根据预先训练的识别模型、每种状态数据对应的令牌和预设的分类令牌确定目标对象所属的目标类型。本公开中状态数据对应的令牌,结合了状态数据与状态数据的位置,使得识别模型能够学习到各种状态数据之间的关联,从而提高识别的准确度。识别的准确度。识别的准确度。

【技术实现步骤摘要】
信息的识别方法、装置、存储介质和电子设备


[0001]本公开涉及电子信息处理
,具体地,涉及一种信息的识别方法、装置、存储介质和电子设备。

技术介绍

[0002]随着电子信息技术的不断发展,越来越多的检查手段和检查设备,能够采集反映检查对象体征状态的信息,使得研究人员可以通过分析这些信息来识别对象的类型。例如通过采集对象的饮食习惯、锻炼方式、基因序列等信息预测青少年的体重属于过重类型、过轻类型、适中类型,或者通过采集血液参数、激素参数、蛋白质属性、基因序列等信息预测用户的血压属于正常类型、高压类型、低压类型。通常情况下,可以通过统计大量信息得到统计模型,由研究人员根据统计模型对检查对象进行评分,以识别检查对象的类习惯。然而,受限于研究人员的经验,评分结果往往带有主观性,并且容易忽略多种信息之间的关联性,导致识别的准确度较低。

技术实现思路

[0003]本公开的目的是提供一种信息的识别方法、装置、存储介质和电子设备,用于解决现有技术中存在的相关问题。
[0004]为了实现上述目的,根据本公开实施例的第一方面,提供一种信息的识别方法,所述方法包括:
[0005]获取目标对象的待识别信息,所述待识别信息用于表征所述目标对象的状态,所述待识别信息包括:按照预设顺序排列的多种状态数据;
[0006]根据所述待识别信息中每种所述状态数据对应的表征向量,和该状态数据对应的位置向量,确定该状态数据对应的令牌,所述表征向量用于表征该状态数据,所述位置向量用于指示该状态数据在所述待识别信息中的顺序;
[0007]根据预先训练的识别模型、每种所述状态数据对应的令牌和预设的分类令牌确定所述目标对象所属的目标类型。
[0008]可选地,每种所述状态数据属于对象属性、检查信息、调查信息中的一种;在所述根据所述待识别信息中每种所述状态数据对应的表征向量,和该状态数据对应的位置向量,确定该状态数据对应的令牌之前,所述方法还包括:
[0009]针对每种所述状态数据,若该状态数据为非文本类型,按照该状态数据对应的取值范围对该状态数据进行离散化处理,将离散化处理后的该状态数据进行编码,并将编码结果输入嵌入层,以得到所述嵌入层输出的该状态数据对应的所述表征向量;
[0010]若该状态数据为文本类型,将该状态数据输入预训练模型,以得到所述预训练模型输出的该状态数据对应的所述表征向量。
[0011]可选地,所述识别模型包括:多个编码器和分类层,所述根据预先训练的识别模型、每种所述状态数据对应的令牌和预设的分类令牌确定所述目标对象所属的目标类型,
包括:
[0012]将每种所述状态数据对应的令牌和所述分类令牌输入每个所述编码器,以得到该编码器输出的特征向量;
[0013]将多个所述编码器输出的所述特征向量,输入所述分类层,以得到所述分类层输出的所述目标类型。
[0014]可选地,所述将每种所述状态数据对应的令牌和所述分类令牌输入每个所述编码器,以得到该编码器输出的特征向量,包括:
[0015]利用该编码器中的高斯先验函数层,对每种所述状态数据对应的令牌和所述分类令牌进行处理,以得到每种所述状态数据对应的先验令牌和先验分类令牌,所述先验令牌和所述先验分类令牌均满足高斯先验分布;
[0016]利用该编码器中的自注意力层,确定每种所述状态数据对应的先验令牌对应的注意力权重,和所述先验分类令牌对应的注意力权重;
[0017]利用该编码器中的前馈网络,根据每种所述状态数据对应的先验令牌对应的注意力权重,和所述先验分类令牌对应的注意力权重,确定所述特征向量。
[0018]可选地,所述将多个所述编码器输出的所述特征向量,输入所述分类层,以得到所述分类层输出的所述目标类型,包括:
[0019]将多个所述编码器输出的所述特征向量,输入所述分类层中的层标准化层;
[0020]将所述层标准化层的输出,输入所述分类层中多个依次连接的全连接层,根据最后一个所述全连接层的输出确定所述目标类型。
[0021]可选地,所述预设顺序根据每种所述状态数据的关联度确定,所述关联度用于表征该状态数据与对象的状态的关联程度;
[0022]该状态数据在所述待识别信息中的位置,与所述待识别信息中的指定位置之间的距离,与该状态数据的关联度负相关。
[0023]可选地,所述识别模型是通过以下方式训练得到的:
[0024]获取多个样本对象的样本信息,所述样本信息用于表征对应的样本对象的状态,所述样本信息包括:按照所述预设顺序排列的多种样本状态数据;
[0025]根据该样本对象的每种样本状态数据对应的样本表征向量,和该样本状态数据对应的样本位置向量,确定该样本状态数据对应的样本令牌,所述样本表征向量用于表征该样本状态数据,所述样本位置向量用于指示该样本状态数据在所述样本信息中的顺序;
[0026]将该样本对象的多种所述样本状态数据对应的样本令牌和预设的样本分类令牌,作为该样本对象对应的样本输入,以得到包括每个所述样本对象对应的样本输入的样本输入集;
[0027]获取样本输出集,所述样本输出集中包括与每个所述样本输入对应的样本输出,每个所述样本输出包括对应的所述样本对象所属的真实类型;
[0028]将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型。
[0029]根据本公开实施例的第二方面,提供一种信息的识别装置,所述装置包括:
[0030]获取模块,用于获取目标对象的待识别信息,所述待识别信息用于表征所述目标对象的状态,所述待识别信息包括:按照预设顺序排列的多种状态数据;
[0031]确定模块,用于根据所述待识别信息中每种所述状态数据对应的表征向量,和该状态数据对应的位置向量,确定该状态数据对应的令牌,所述表征向量用于表征该状态数据,所述位置向量用于指示该状态数据在所述待识别信息中的顺序;
[0032]识别模块,用于根据预先训练的识别模型、每种所述状态数据对应的令牌和预设的分类令牌确定所述目标对象所属的目标类型。
[0033]可选地,每种所述状态数据属于对象属性、检查信息、调查信息中的一种;所述装置还包括:
[0034]表征模块,用于在所述根据所述待识别信息中每种所述状态数据对应的表征向量,和该状态数据对应的位置向量,确定该状态数据对应的令牌之前,针对每种所述状态数据,若该状态数据为非文本类型,按照该状态数据对应的取值范围对该状态数据进行离散化处理,将离散化处理后的该状态数据进行编码,并将编码结果输入嵌入层,以得到所述嵌入层输出的该状态数据对应的所述表征向量;若该状态数据为文本类型,将该状态数据输入预训练模型,以得到所述预训练模型输出的该状态数据对应的所述表征向量。
[0035]可选地,所述识别模型包括:多个编码器和分类层,所述识别模块包括:
[0036]编码子模块,用于将每种所述状态数据对应的令牌和所述分类令本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息的识别方法,其特征在于,所述方法包括:获取目标对象的待识别信息,所述待识别信息用于表征所述目标对象的状态,所述待识别信息包括:按照预设顺序排列的多种状态数据;根据所述待识别信息中每种所述状态数据对应的表征向量,和该状态数据对应的位置向量,确定该状态数据对应的令牌,所述表征向量用于表征该状态数据,所述位置向量用于指示该状态数据在所述待识别信息中的顺序;根据预先训练的识别模型、每种所述状态数据对应的令牌和预设的分类令牌确定所述目标对象所属的目标类型。2.根据权利要求1所述的方法,其特征在于,每种所述状态数据属于对象属性、检查信息、调查信息中的一种;在所述根据所述待识别信息中每种所述状态数据对应的表征向量,和该状态数据对应的位置向量,确定该状态数据对应的令牌之前,所述方法还包括:针对每种所述状态数据,若该状态数据为非文本类型,按照该状态数据对应的取值范围对该状态数据进行离散化处理,将离散化处理后的该状态数据进行编码,并将编码结果输入嵌入层,以得到所述嵌入层输出的该状态数据对应的所述表征向量;若该状态数据为文本类型,将该状态数据输入预训练模型,以得到所述预训练模型输出的该状态数据对应的所述表征向量。3.根据权利要求1所述的方法,其特征在于,所述识别模型包括:多个编码器和分类层,所述根据预先训练的识别模型、每种所述状态数据对应的令牌和预设的分类令牌确定所述目标对象所属的目标类型,包括:将每种所述状态数据对应的令牌和所述分类令牌输入每个所述编码器,以得到该编码器输出的特征向量;将多个所述编码器输出的所述特征向量,输入所述分类层,以得到所述分类层输出的所述目标类型。4.根据权利要求3所述的方法,其特征在于,所述将每种所述状态数据对应的令牌和所述分类令牌输入每个所述编码器,以得到该编码器输出的特征向量,包括:利用该编码器中的高斯先验函数层,对每种所述状态数据对应的令牌和所述分类令牌进行处理,以得到每种所述状态数据对应的先验令牌和先验分类令牌,所述先验令牌和所述先验分类令牌均满足高斯先验分布;利用该编码器中的自注意力层,确定每种所述状态数据对应的先验令牌对应的注意力权重,和所述先验分类令牌对应的注意力权重;利用该编码器中的前馈网络,根据每种所述状态数据对应的先验令牌对应的注意力权重,和所述先验分类令牌对应的注意力权重,确定所述特征向量。5.根据权利要求3所述的方法,其特征在于,所述将多个所述编码器输出的所述特征向量,输入所述分类层,以得到所述分类层输出的所述目标类型,包括:将多个所述编码器输出的...

【专利技术属性】
技术研发人员:李彦东冯仓龙王挺顺
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1