一种基于强化学习的光照度调整方法技术

技术编号：39059963 阅读：23 留言：0更新日期：2023-10-12 19:53

本发明专利技术公开了一种基于强化学习的光照度调整方法，以解决现有技术无法同时对可见光光源阵列中各个可调光源进行调节，使得多个照度测试点位同时达到照度要求的问题。本发明专利技术通过同时收集各个照度测试点位照度计的反馈值，利用强化学习方法，自动调节可见光光源阵列中的各个可调可见光光源的控制参数值，通过算法的不断迭代，实现调节自动化的同时还能够满足各个照度测试点位的照度要求。利用本发明专利技术提供的控制方法，可以有效的解决可见光光源阵列对于各个辐射点位的照度控制需求，完善并丰富可见光光源阵列的应用场景。光光源阵列的应用场景。光光源阵列的应用场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的光照度调整方法

[0001]本专利技术涉及光照度控制方法，具体涉及一种基于强化学习的光照度调整方法。

技术介绍

[0002]可见光光源是一类十分常见的照明设备，这类设备通常包括Led光源、氙灯光源、白炽灯等。当可见光光源点亮后，可以通过照度计测量照度值，来表征在一定距离下可见光光源的光强程度。该照度值的测量通常利用照度计在与可见光光源一定距离处读取测量值来实现，测量值的读数通常以勒克斯(Lux，符号lx)为单位进行计量。而对于可见光光源的照度值的调节，通常利用改变可见光光源控制器中的控制参数(电压、电流等)，进而单调而连续地改变可见光光源的照度值。所以，在与可见光光源一定距离处的照度值与控制可见光光源照度的控制参数有一定的单调映射关系，记为：E＝F(A)，其中E表示照度值，A表示控制可见光光源照度值的控制参数，E随着A的增大而增大。当然如果照度计距离可见光光源的远近不同时，其映射函数F会有所不同，但是F将A映射到E的单调递增关系不会改变，其中A和E均为连续值。
[0003]在利用可见光光源进行照明时，有一类照明应用会根据对可见光光源的具体使用场景，对可见光光源辐照范围内的某一固定点位放置照度计，通过改变可见光光源的控制参数，将照度计显示的照度值调节至一个大致满足应用需求的范围内。这种应用需求的操作可以通过人工调节的方式进行，因为这种调节只涉及到单一可见光光源的照度值调节，操作较为简便。而当单一可见光光源扩展至可见光光源阵列时，且对于光源阵列辐照范围内多个点位的照度值都有一定的控制需求时，就需...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的光照度调整方法，用于可见光光源阵列，其特征在于，包括以下步骤：步骤1、所述可见光光源阵列包括n个可见光光源，其中m个可见光光源可通过控制参数调整光照度，用集合Φ＝{L1，L2，
…
，L
m
}表示，n≥2，n≥m；第k个可见光光源的照度控制参数值为参数可调范围为参数可调范围为可见光光源阵列辐照范围内放置有p个用于监视并实时反馈照度值的照度计，用集合Γ＝{Z1，Z2，
…
，Z
p
}表示，第r个照度计的最终调节值E
Zr
满足步骤2、构造两个结构完全相同的评估神经网络Q(a
t
，s
t
|ω
tQ
)、Q
′
(a
t
，s
t
|ω
tQ
′
)以及两个结构完全相同的动作神经网络μ(s
t
|ω
tμ
)、μ
′
(s
t
|ω
tμ
′
)；其中，ω
tQ
、ω
tQ
′
、ω
tμ
、ω
tμ
′
为t阶段的神经网络的参数；开辟一个维度大小为M
×
(m+2p+1)的经验存储池，该经验存储池共可以存储M条经验，每次可存储以(a
t
，s
t
，s
t+1
，R
t
)为构造的单条经验，该单条经验大小为(m+2p+1)；同时，该经验存储池可提取N个单条经验用于计算，N≤M，该经验存储池一直保持更新且经验总数小于或等于M；a
t
为t阶段动作向量；s
t
为t阶段状态向量，为t阶段奖励函数；表示t阶段的表示t阶段的表示t阶段的表示t阶段的表示t阶段的V
sum
；V
sum
为所有1≤r≤p的和值，通过t阶段的照度计的值计算得到；t阶段表示可见光光源阵列中所有可调的可见光光源依据神经网络计算出的照度控制参数值改变辐照范围内照度的任一调整过程；步骤3、依据神经网络计算照度控制参数值：3.1)设置阶段计数变量t＝0，将第0阶段状态向...

【专利技术属性】
技术研发人员：郭毅，胡炳樑，李思远，张耿，
申请(专利权)人：中国科学院西安光学精密机械研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人