眼轴预测模型的训练方法、眼轴预测方法和装置制造方法及图纸

技术编号:38721678 阅读:11 留言:0更新日期:2023-09-08 23:16
本公开提供一种眼轴预测模型的训练方法、眼轴预测方法和装置,包括:训练信息提取模型;基于信息提取模型确定目标眼底图像对应的层级特征向量;基于词向量模型确定目标对象的生理信息文本向量;基于目标眼底图像对应的层级特征向量和生理信息文本向量,对网络模型结构进行训练,得到眼轴预测模型。其中,眼轴预测模型中包括时间块机制。从而,通过设定时间token以及模型结构,能够有效利用多次随访数据,不需要固定的输入数据形式,在任意时间点采集的数据均可以利用训练模型训练得到的眼轴预测模型,能够对目标对象的未来眼轴进行有效预测,提升未来眼轴的预测准确度,也解决了现有技术的预测模型难以推广实现的技术问题。技术的预测模型难以推广实现的技术问题。技术的预测模型难以推广实现的技术问题。

【技术实现步骤摘要】
眼轴预测模型的训练方法、眼轴预测方法和装置


[0001]本公开的实施例涉及人工智能
,具体地,涉及适用于一种眼轴预测模型的训练方法、眼轴预测方法和装置。

技术介绍

[0002]眼轴为把眼睛看作一台光学仪器来描述,从眼球接收光线的最表层,即从角膜

晶状体

玻璃体

视网膜(感受光线最里的一层)的距离看成是物理中的光学系统的一条中轴线。
[0003]相关技术中,在进行未来眼轴预测时,如果采用现有技术只能将时间变量作为输入数据直接输入到模型中对模型进行训练,现有技术的模型主要有两种方式,一种是根据当前单一的固定时间点的眼轴测量数据去预测未来某一时间点的眼轴,第二种是根据当前N个固定的时间点的眼轴测量数据去预测未来某一时间点的眼轴,例如根据时间点1、时间点2、......、时间点N预测时间点N+1的眼轴。以上两种方式,都存在输入的数据与时间位置固定,输入形式必须对应的问题,但是在实际测量场景中,这种模型无法利用不定时的输入数据,与实际数据采集情况不符,难以推广实现,模型也难以进行预测;即使按照模型固定输入形式输入了数据,由于输入数据的时间位置必须固定对应,依然会导致模型无法智能的利用其他非预设时间点输入的数据,存在模型预测眼轴的准确度较低的技术问题。

技术实现思路

[0004]本文中描述的实施例提供了一种眼轴预测模型的训练方法、眼轴预测方法和装置,克服了上述问题。
[0005]第一方面,根据本公开的内容,提供了一种眼轴预测模型的训练方法,包括:
[0006]训练信息提取模型,所述信息提取模型用于提取眼底图像对应的层级特征向量,所述层级特征向量包括:第一层级向量和第二层级向量,所述信息提取模型包括第一子模型和第二子模型,所述第一子模型用于提取所述第一层级向量,所述第二子模型用于提取所述第二层级向量,所述第一层级向量用于描述与近视病灶无关的向量,所述第二层级向量用于描述与近视病灶相关的向量;
[0007]基于所述信息提取模型确定目标眼底图像对应的层级特征向量,所述目标眼底图像中包括目标对象不同年龄/相同年龄的不同月份的眼底图像,所述目标眼底图像对应的层级特征向量用于描述所述目标对象的轴性近视相关信息向量;
[0008]基于词向量模型确定所述目标对象的生理信息文本向量;
[0009]基于所述目标眼底图像对应的层级特征向量和所述生理信息文本向量,对网络模型结构进行训练,得到眼轴预测模型,所述眼轴预测模型用于对所述目标对象进行时间序列眼轴预测,所述时间序列眼轴预测用于预测所述目标对象的未来眼轴;
[0010]其中,所述眼轴预测模型中包括时间块机制,所述时间块机制用于划分所述目标对象的年龄/月份,使得所述目标眼底图像对应的层级特征向量和所述生理信息文本向量
均隶属于所述目标对象的不同年龄/相同年龄的不同月份。
[0011]第二方面,根据本公开的内容,提供了一种眼轴预测方法,包括:
[0012]获取待预测眼底图像,所述待预测眼底图像中包括目标对象不同年龄/相同年龄的不同月份的眼底图像;
[0013]将所述待预测眼底图像输入信息提取模型中,根据所述信息提取模型的输出确定所述待预测眼底图像对应的层级特征向量;
[0014]基于词向量模型确定所述目标对象的生理信息文本向量;
[0015]将所述待预测眼底图像对应的层级特征向量以及所述生理信息文本向量输入眼轴预测模型中,根据所述眼轴预测模型的输出确定所述目标对象的未来眼轴;
[0016]其中,所述眼轴预测模型为第一方面中任一项所述的方法所训练生成的眼轴预测模型,所述信息提取模型为第一方面中任一项所述的方法所训练生成的信息提取模型。
[0017]第三方面,根据本公开的内容,提供了一种眼轴预测模型的训练装置,包括:
[0018]第一训练构建模块,用于训练信息提取模型,所述信息提取模型用于提取眼底图像对应的层级特征向量,所述层级特征向量包括:第一层级向量和第二层级向量,所述信息提取模型包括第一子模型和第二子模型,所述第一子模型用于提取所述第一层级向量,所述第二子模型用于提取所述第二层级向量,所述第一层级向量用于描述与近视病灶无关的向量,所述第二层级向量用于描述与近视病灶相关的向量;
[0019]第一确定模块,用于基于所述信息提取模型确定目标眼底图像对应的层级特征向量,所述目标眼底图像中包括目标对象不同年龄/相同年龄的不同月份的眼底图像,所述目标眼底图像对应的层级特征向量用于描述所述目标对象的轴性近视相关信息向量;
[0020]第二确定模块,用于基于词向量模型确定所述目标对象的生理信息文本向量;
[0021]第二训练模块,用于基于所述目标眼底图像对应的层级特征向量和所述生理信息文本向量,对网络模型结构进行训练,得到眼轴预测模型,所述眼轴预测模型用于对所述目标对象进行时间序列眼轴预测,所述时间序列眼轴预测用于预测所述目标对象的未来眼轴;
[0022]其中,所述眼轴预测模型中包括时间块机制,所述时间块机制用于划分所述目标对象的年龄/月份,使得所述目标眼底图像对应的层级特征向量和所述生理信息文本向量均隶属于所述目标对象的不同年龄/相同年龄的不同月份。
[0023]第四方面,根据本公开的内容,提供了一种眼轴预测装置,包括:
[0024]获取模块,用于获取待预测眼底图像,所述待预测眼底图像中包括目标对象不同年龄/相同年龄的不同月份的眼底图像;
[0025]提取模块,用于将所述待预测眼底图像输入信息提取模型中,根据所述信息提取模型的输出确定所述待预测眼底图像对应的层级特征向量;
[0026]第三确定模块,用于基于词向量模型确定所述目标对象的生理信息文本向量;
[0027]第四确定模块,用于将所述待预测眼底图像对应的层级特征向量以及所述生理信息文本向量输入眼轴预测模型中,根据所述眼轴预测模型的输出确定所述目标对象的未来眼轴;
[0028]其中,所述眼轴预测模型为第一方面中任一项所述的方法所训练生成的眼轴预测模型,所述信息提取模型为第一方面中任一项所述的方法所训练生成的信息提取模型。
[0029]第五方面,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,处理器执行计算机程序时实现如以上任意一个实施例中眼轴预测模型的训练方法的步骤,或者,实现如以上任意一个实施例中眼轴预测方法的步骤。
[0030]第六方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如以上任意一个实施例中眼轴预测模型的训练方法的步骤,或者,实现如以上任意一个实施例中眼轴预测方法的步骤。
[0031]本申请实施例提供的眼轴预测模型的训练方法,训练信息提取模型,信息提取模型用于提取眼底图像对应的层级特征向量,层级特征向量包括:第一层级向量和第二层级向量,信息提取模型包括第一子模型和第二子模型,第一子模型用于提取第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种眼轴预测模型的训练方法,其特征在于,包括:训练信息提取模型,所述信息提取模型用于提取眼底图像对应的层级特征向量,所述层级特征向量包括:第一层级向量和第二层级向量,所述信息提取模型包括第一子模型和第二子模型,所述第一子模型用于提取所述第一层级向量,所述第二子模型用于提取所述第二层级向量,所述第一层级向量用于描述与近视病灶无关的向量,所述第二层级向量用于描述与近视病灶相关的向量;基于所述信息提取模型确定目标眼底图像对应的层级特征向量,所述目标眼底图像中包括目标对象不同年龄/相同年龄的不同月份的眼底图像,所述目标眼底图像对应的层级特征向量用于描述所述目标对象的轴性近视相关信息向量;基于词向量模型确定所述目标对象的生理信息文本向量;基于所述目标眼底图像对应的层级特征向量和所述生理信息文本向量,对网络模型结构进行训练,得到眼轴预测模型,所述眼轴预测模型用于对所述目标对象进行时间序列眼轴预测,所述时间序列眼轴预测用于预测所述目标对象的未来眼轴;其中,所述眼轴预测模型中包括时间块机制,所述时间块机制用于划分所述目标对象的年龄/月份,使得所述目标眼底图像对应的层级特征向量和所述生理信息文本向量均隶属于所述目标对象的不同年龄/相同年龄的不同月份。2.根据权利要求1所述的方法,其特征在于,所述训练信息提取模型,包括:采集所述目标对象处于不同年龄/相同年龄的不同月份的当前眼底图像以及当前特征向量,所述当前特征向量用于描述不同年龄/相同年龄的不同月份对应的多个层级特征的向量,多个所述层级特征包括:近视病灶相关特征以及近视病灶无关特征,所述近视病灶无关特征包括:年龄、性别、眼别、屈光度和眼前节;基于所述近视病灶无关特征的向量和所述当前眼底图像,利用第一损失函数对卷积神经网络进行训练,得到第一子模型,所述第一损失函数为均方损失函数;基于所述近视病灶相关特征的向量和所述当前眼底图像,利用第二损失函数对图像分割网络进行训练,得到第二子模型,所述第二损失函数用于描述交叉熵损失函数;其中,所述第一子模型用于描述所述卷积神经网络中FC层之前的网络层,所述第二子模型用于描述所述图像分割网络中的中间embedding层以及所述中间embedding层之前的网络层,所述第一子模型为自回归模型,所述第一损失函数为所述自回归模型中的损失函数,所述第二子模型为所述中间embedding层以及所述中间embedding层之前的网络层组成的模型,所述第二损失函数为所述第二子模型中的损失函数。3.根据权利要求1所述的方法,其特征在于,所述时间块机制中设置时间token,所述时间token用于表征所述目标眼底图像中相连的两个所述眼底图像的年龄差/月份差;所述基于所述目标眼底图像对应的层级特征向量和所述生理信息文本向量,对网络模型结构进行训练,得到眼轴预测模型,包括:基于所述时间token和每个所述眼底图像对应的年龄/月份,获取所述目标眼底图像对应的预测眼轴;基于每个所述眼底图像对应的年龄/月份,将每个所述眼底图像对应的层级特征向量和所述生理信息文本向量作为模型输入,并将对应的每个所述眼底图像的预测眼轴作为模型输出,通过所述预测眼轴与所述预测眼轴的年龄/月份对应的实际眼轴之间的差值,训练
所述网络模型结构,得到所述眼轴预测模型;其中,所述预测眼轴中包括多个眼轴,多个所述眼轴中首个眼轴的年龄/月份由所述时间token和所述生理信息文本向量中首个眼轴确定,所述预测眼轴中每个眼轴的年龄/月份和所述生理信息文本向量中每个眼轴的年龄/月份均按相同顺序排列;所述实际眼轴通过所述层级特征向量获取。4.根据权利要求3所述的方法,其特征在于,所述基于每个所述眼底图像对应的年龄/月份,将每个所述眼底图像对应的层级特征向量和所述生理信息文本向量作为模型输入,并将对应的每个所述眼底图像的预测眼轴作为模型输出,通过所述预测眼轴与所述预测眼轴的年龄/月份对应的实际眼轴之间的差值,训练所述网络模型结构,得到所述眼轴预测模型,包括:基于每个所述眼底图像对应的年龄/月份,依次将所述眼底图像对应的层级特征向量和所述生理信息文本向量输入所述网络模型结构;确定所述网络模型结构输出的所述预测眼轴,与所述预测眼轴的年龄/月份对应的实际眼轴之间的差值;在所述网络模型结...

【专利技术属性】
技术研发人员:李美燕杨卫明周行涛王韵哲宋凯敏王斌张大磊
申请(专利权)人:北京鹰瞳科技发展股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1