一种基于拓展偏置张量隐特征分解的视频修复方法和装置制造方法及图纸

技术编号:39835585 阅读:14 留言:0更新日期:2023-12-29 16:19
本发明专利技术公开一种基于拓展偏置张量隐特征分解的视频修复方法和装置,包括以下步骤:

【技术实现步骤摘要】
一种基于拓展偏置张量隐特征分解的视频修复方法和装置


[0001]本专利技术涉及视频数据处理
,特别涉及一种基于拓展偏置张量隐特征分解的视频修复方法和装置


技术介绍

[0002]随着机器视觉技术的不断发展,视频采集已经成为工业领域实现自动化生产的流行技术

在这种情况下,基于机器视觉技术采集到的视频数据能够代替人眼进行测量和判断,对工业中的各种应用场景提供辅助决策或自行决策

视频分析和视频管理功能可以为工业生产自动化提供有效的指导

端到端的视频数据是许多视频分析和视频管理的基本输入

此外,根据视频数据信息还能发现工业生产环节存在的异常和漏洞

由于复杂的工业环境导致采集到的视频存在遮挡或噪声,使得视频质量缺失以及不稳定

因此,如何对视频数据进行有效的修复是一个关键问题

[0003]目前,许多研究人员提出了基于隐特征分解的模型修复未知的视频数据,其使用已知的历史视频数据修复未知的视频数据

然而,基于隐特征分解的视频数据修复方法将历史视频数据构造成静态的多维矩阵再进行未知视频数据的修复,但是视频是随时间变化所产生的一系列图像,基于隐特征分解的修复方法无法有效体现视频数据的时序性,因此造成修复精度低的问题

此外,由于视频数据在采集过程中随时间波动,导致视频数据不稳定


技术实现思路

[0004]针对现有技术中视频数据修复精度较低的问题,本专利技术提出一种基于拓展偏置张量隐特征分解的视频修复方法和装置

[0005]为了实现上述目的,本专利技术提供以下技术方案:
[0006]一种基于拓展偏置张量隐特征分解的视频修复方法,包括以下步骤:
[0007]S1
:从服务器获取视频数据并进行存储;
[0008]S2
:根据视频数据构造视频张量;
[0009]S3
:根据视频数据构造视频数据拓展线性偏差矩阵;
[0010]S4
:根据视频张量和视频数据拓展线性偏差矩阵构建视频数据修复预测模型的目标函数,并进行优化迭代;
[0011]S5
:根据
S4
优化迭代得到的拓展线性偏差矩阵
A、B
和隐特征矩阵
U、V、W
,计算视频数据修复值

[0012]优选地
,
所述
S1
中,视频数据以四元组的形式进行存储,四元组表示形式为
T

(u,v,t,w)
,其中
u
表示视频中单帧图像的长,
v
表示视频中单帧图像的宽,
t
表示视频中产生单帧图像的长
u
和单帧图像的宽
v
的时间段,
w
表示视频中单帧图像的长
u
和单帧图像的宽
v
在时间段
t
产生的像素值

[0013]优选地
,
所述
S2
中,视频张量的构造方法为:
[0014]将所有的四元组
P

(u,v,t,w)
按照时间段
t
划分成
K
个时间段;从中选择出
t
=1的四元组
P
(1)

(u,v,1,w)
,构造切片矩阵
Q
(1)

Q
(1)
的大小为
I
行,
J
列,矩阵中的元素
Q
(1)ij
表示在第1个时间段视频中单帧图像的长
i
和单帧图像的宽
j
产生的像素,
1≤i≤I

1≤j≤J

[0015]再从四元组
P

(u,v,t,w)
中依次选择出四元组
P
(2)
、P
(3)


、P
(K)
分别构造切片矩阵
Q
(2)
、Q
(3)


、Q
(K)

[0016]最后用
K
个切片矩阵在三维空间中根据划分的
K
个时间段由小到大依次从前到后排列构造三维视频张量
Z∈R
I
×
J
×
K

R
表示实数集,
I
表示视频中图像的总长度,
J
表示视频中图像的总宽度,
K
表示时间段集合

[0017]优选地
,
所述
S3
包括:
[0018]S3
‑1:根据视频数据创建视频中所有单帧图像的长对应的拓展线性偏差
A
,其中,
α
im
表示第
i
个单帧图像的长对应的第
m
个线性偏差,并且
A
的大小为
I
×
M
,其中
M
=3;
[0019]S3
‑2:根据视频数据创建视频中所有单帧图像的宽对应的的拓展线性偏差
B

b
jn
的表示第
j
个单帧图像的宽对应的第
n
个拓展线性偏差,并且
B
的大小为
J
×
N
,其中
N

2。
[0020]优选地
,
所述
S4
包括:
[0021]S4
‑1:初始化视频数据修复预测的过程参数;
[0022]S4
‑2:对视频数据张量
Z
的已知数据集合
Γ
,构造目标损失函数;
[0023]S4
‑3:使用非负乘法更新规则对目标损失函数进行迭代优化;
[0024]S4
‑4:判断目标函数是否在已知数据集合
Γ
上收敛

[0025]优选地
,
所述
S4
‑1中,过程参数包括视频张量
Z
,单帧图像的长的隐特征矩阵
U、
单帧图像的宽的
V、
时间隐特征矩阵
W
;隐特征维数
F
;最大训练迭代轮数
D
;训练过程中迭代轮数控制变量
d
;收敛终止阈值
τ...

【技术保护点】

【技术特征摘要】
1.
一种基于拓展偏置张量隐特征分解的视频修复方法,其特征在于
,
包括以下步骤:
S1
:从服务器获取视频数据并进行存储;
S2
:根据视频数据构造视频张量;
S3
:根据视频数据构造视频数据拓展线性偏差矩阵;
S4
:根据视频张量和视频数据拓展线性偏差矩阵构建视频数据修复预测模型的目标函数,并进行优化迭代;
S5
:根据
S4
优化迭代得到的拓展线性偏差矩阵
A、B
和隐特征矩阵
U、V、W
,计算视频数据修复值
。2.
如权利要求1所述的一种基于拓展偏置张量隐特征分解的视频修复方法,其特征在于
,
所述
S1
中,视频数据以四元组的形式进行存储,四元组表示形式为
T

(u,v,t,w)
,其中
u
表示视频中单帧图像的长,
v
表示视频中单帧图像的宽,
t
表示视频中产生单帧图像的长
u
和单帧图像的宽
v
的时间段,
w
表示视频中单帧图像的长
u
和单帧图像的宽
v
在时间段
t
产生的像素值
。3.
如权利要求1所述的一种基于拓展偏置张量隐特征分解的视频修复方法,其特征在于
,
所述
S2
中,视频张量的构造方法为:将所有的四元组
P

(u,v,t,w)
按照时间段
t
划分成
K
个时间段;从中选择出
t
=1的四元组
P
(1)

(u,v,1,w)
,构造切片矩阵
Q
(1)

Q
(1)
的大小为
I
行,
J
列,矩阵中的元素
Q
(1)ij
表示在第1个时间段视频中单帧图像的长
i
和单帧图像的宽
j
产生的像素,
1≤i≤I

1≤j≤J
;再从四元组
P

(u,v,t,w)
中依次选择出四元组
P
(2)
、P
(3)


、P
(K)
分别构造切片矩阵
Q
(2)
、Q
(3)


、Q
(K)
;最后用
K
个切片矩阵在三维空间中根据划分的
K
个时间段由小到大依次从前到后排列构造三维视频张量
Z∈R
I
×
J
×
K

R
表示实数集,
I
表示视频中图像的总长度,
J
表示视频中图像的总宽度,
K
表示时间段集合
。4.
如权利要求1所述的一种基于拓展偏置张量隐特征分解的视频修复方法,其特征在于
,
所述
S3
包括:
S3
‑1:根据视频数据创建视频中所有单帧图像的长对应的拓展线性偏差
A
,其中,
α
im
表示第
i
个单帧图像的长对应的第
m
个线性偏差,并且
A
的大小为
I
×
M
,其中
M
=3;
S3
‑2:根据视频数据创建视频中所有单帧图像的宽对应的的拓展线性偏差
B

b
jn
的表示第
j
个单帧图像的宽对应的第
n
个拓展线性偏差,并且
B
的大小为
J
×
N
,其中
N

2。5.
如权利要求1所述的一种基于拓展偏置张量隐特征分解的视频修复方法,其特征在于
,
所述
S4
包括:
S4
‑1:初始化视频数据修复预测的过程参数;
S4
‑2:对视频数据张量
Z
的已知数据集合
Γ
,构造目标损失函数;
S4
‑3:使用非负乘法更新规则对目标损失函数进行迭代优化;
S4
‑4:判断目标函数是否在已知数据集合
Γ
上收敛
。6.
如权利要求5所述的一种基于拓展偏置张量隐特征分解的视频修复方法,其特征在于
,
所述
S4
‑1中,过程参数包括视频张量
Z
,单帧图像的长的隐特征矩阵
U、
单帧图像的宽的
V、
时间隐特征矩阵
W
;隐特征维数
F
;最大训练迭代轮数
D
;训练过程中迭代轮数控制变量
d
;收敛终止阈值
τ
;正则化因子
η
u

η
v

η
w

η
a

η
b
;其中:
隐特征维数
F
决定了隐特征矩阵
U、V、W
的隐特征空间维数;隐特征矩阵
U、V、W
的大小由对应的视频张量
Z
的每个维度值和隐特征维数
F
确定,即
U

I

F
的隐特征矩阵
、V

J

F
列的隐特征矩阵
、W

K

F
列的隐特征矩阵;最大训练迭代轮数
D
是控制迭代过程上限的变量;迭代轮数控制变量
d
初始化为0;收敛终止阈值
τ
是判断迭代过程是否已收敛的参数;正则化因子
η

【专利技术属性】
技术研发人员:肖雪高莎艾思岐黄麟魏嘉
申请(专利权)人:国器智眸重庆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1