基于遗传算法和BP神经网络的索引图预测方法技术

技术编号:26691338 阅读:41 留言:0更新日期:2020-12-12 02:43
本发明专利技术公开一种基于遗传算法和BP神经网络的索引图预测方法,首先,发掘BP神经网络良好的预测和泛化能力,建立了一种用于索引图预测编码的BP神经网络模型,从而利用待预测像素周围、因果邻域内的4个像素作为BP神经网络模型的输入,对待预测像素的索引值进行预测,能有效刻画索引图的全局数据相关和非局部相关的特定索引模式;其次,引进具有全局搜索能力的遗传算法来优化BP神经网络的初始连接权值和神经元阈值,建立了一种基于遗传算法的BP神经网络模型GA‑BP,从而降低BP神经网络对初始连接权值和神经元阈值的敏感性,提高了网络训练的速度和精度。

【技术实现步骤摘要】
基于遗传算法和BP神经网络的索引图预测方法
本专利技术涉及屏幕内容视频编码领域,尤其是一种可有效降低全局数据冗余、准确性高、处理速度快及具备方向自适应能力的基于遗传算法和BP神经网络的索引图预测方法。
技术介绍
云存储和移动通信的迅猛发展催生了虚拟桌面、桌面云、无线显示和云游戏等诸多应用,均要求把计算机屏幕的显示内容通过网络链路传输到远程客户端,以实现屏幕协同共享。同时,具有宽动态范围、广色域特性的超高清晰度屏幕和3D虚拟现实也要求在设备之间或设备内部通过排线和接口电路以视频方式实时、低延时地传输显示流。由于屏幕内容图像和视频一般是各种应用软件生成的,如办公软件、3D游戏、数字动画、网络浏览器等,它往往由文本、图形和自然图像等若干不同类型的区域混合而成,并且数据量巨大。若要在目前的宽带网络或串行总线上同步即时传输如此海量的数据,将屏幕内容视频进行高效率压缩来降低带宽需求是一个必不可少的环节。不过,与摄像机所拍摄的自然内容不同,屏幕内容不受传感器噪声的影响,具有像素颜色种类少、文字和图形边缘对比度高等特点,导致传统的自然视频编码方法对屏幕内容视频本文档来自技高网...

【技术保护点】
1.一种基于遗传算法和BP神经网络的索引图预测方法,按照如下步骤进行:/n步骤1.输入一段待编码的屏幕内容视频V,令视频V长度为F帧,并令f←1,ch←1;/n步骤2.提取视频V的第f帧、第ch个颜色分量;/n步骤3.计算第f帧、第ch个颜色分量的索引图;/n步骤3.1统计第f帧、第ch个颜色分量的像素值直方图,并选取出现次数最多的4种像素值作为基色,令其为BC

【技术特征摘要】
1.一种基于遗传算法和BP神经网络的索引图预测方法,按照如下步骤进行:
步骤1.输入一段待编码的屏幕内容视频V,令视频V长度为F帧,并令f←1,ch←1;
步骤2.提取视频V的第f帧、第ch个颜色分量;
步骤3.计算第f帧、第ch个颜色分量的索引图;
步骤3.1统计第f帧、第ch个颜色分量的像素值直方图,并选取出现次数最多的4种像素值作为基色,令其为BC0、BC1、BC2和BC3;
步骤3.2按照光栅扫描顺序,根据公式(1)~公式(2)将每个像素p量化为索引值Q(p):






所述Q(p)表示像素p的索引值,I(p)表示像素p的像素值,j*表示与像素值I(p)最接近的基色的下标且j*∈{0,1,2,3},Δ1表示预设的量化步长;
步骤4.利用基于遗传算法优化的BP神经网络GA-BP对第f帧的每个像素p进行预测;
步骤4.1按照光栅扫描顺序,取出第f帧中第一个未被处理过的像素p,令其索引值为Q(p);
步骤4.2若像素p处于第f帧的第1行或第1列或最后1行或最后1列,则采用二次方向预测TDP方法对Q(p)进行预测,转入步骤4.5,否则转入步骤4.3;
步骤4.3在像素p的8-邻域中,令位于p左上方的相邻像素的索引值为Q(ptl),令位于p正上方的相邻像素的索引值为Q(pt),令位于p右上方的相邻像素的索引值为Q(ptr),令位于p左侧的相邻像素的索引值为Q(pl);
步骤4.4将Q(ptl)、Q(pt)、Q(ptr)和Q(pl)输入基于遗传算法优化的BP神经网络GA-BP,计算得到索引值Q(p)的预测值P(p);
步骤4.5输出预测误差Q(p)-P(p),若第f帧的全部像素都已处理完毕,则转入步骤5,否则返回步骤4.1;
步骤5.令ch←ch+1,若ch>3,则转入步骤6,否则转入步骤2;
步骤6.令f←f+1,ch←1,若f≤F,则转入步骤2,否则算法结束。
所述基于遗传算法优化的BP神经网络GA-BP,按照如下步骤训练而成:
步骤7.1输入预设的最大迭代次数Tmax、最大适应度Emin和初始种群规模m;
步骤7.2输入待编码的屏幕内容视频V的第1帧,并提取其亮度分量Vluma;
步骤7.3计算Vluma的索引图;
步骤7.3.1统计Vluma的像素值直方图,并选取出现次数最多的4种像素值作为基色,令其为BC′0、BC′1、BC′2和BC′3;
步骤7.3.2按照光栅扫描顺序,根据公式(3)~公式(4)将每个像素p量化为索引值Q(p):






所述Q(p)表示像素p的索引值,I(p)表示像素p的像素值,j*表示与像素值I(p)最接近的基色的下标且j*∈{0,1,2,3},Δ1表示预设的量化步长;
步骤7.4根据Vluma的索引图,统计Vluma的最小索引值Qmin和最大索引值Qmax;
步骤7.5对于Vluma的每个像素p,根据公式(5)的定义将p的索引值Q(p)进行归一化处理,得到归一化的亮度分量V′luma:



所述Q′(p)表示像素p的归一化索引值;
步骤7.6根据V′luma的空间分辨率,对GA-BP的网络结构进行初始化,令其包含1个输入层、1个隐藏层和1个输出层,并且隐藏层的激活函数为Sigmoid函数,输出层的激活函数为公式(6)定义的线性函数:
y=x(6)
所述x表示输出层的任意神经元的输入,y表示该神经元的输出,若V′luma的空间分辨率小于1920×1080,则转入步骤7.6.1,否则转入步骤7.6.2;
步骤7.6.1令GA-...

【专利技术属性】
技术研发人员:宋传鸣刘定坤郑宏亮王相海
申请(专利权)人:辽宁师范大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1