【技术实现步骤摘要】
一种基于双深度模糊网络的废旧手机价格自适应调整方法
[0001]本专利技术利用手机回收企业真实交易数据,通过建立基于双深度模糊网络的废旧手机价格自适应调整模型,通过与市场状态的交互学习选择合适的调价策略,在废旧手机初步估算价值的基础上进行自适应调整,并通过获得的市场反馈不断改进优化调价策略,使其可以及时响应市场状态的变化,从而保证废旧手机回收定价结果的准确性,属于电子产品回收领域。
技术介绍
[0002]在废旧手机的回收过程中,交易价格是一个重要的指标参数。定价结果的准确性是促进废旧电子产品回收再利用的重要保障,是手机回收市场公平交易的前提。二手电子产品的定价浮动较大,最终交易价格的确定除了受到内部属性的影响外,还常常受到外部市场环境变化的干扰,如上游零件供应商和下游销售渠道的销售能力,这些变化对于产品定价的影响常常是难以量化的。如果价格调整不及时或决策有误,就会很容易丧失订单,造成经济损失。根据市场变化及时调整调价动作,有助于促进废旧手机的回收,具有显著的经济效益。因此,本专利技术的研究成果具有广阔的应用前景。
[ ...
【技术保护点】
【技术特征摘要】
1.一种基于双深度模糊网络的废旧手机价格自适应调整方法,其特征在于,包括以下步骤:(1)基于双深度模糊网络的价格自适应调整模型设计价格自适应调整模型由两个独立的深度模糊网络构成,分别为行为网络和目标网络,网络结构包含五层:输入层、模糊化层、规则层、归一化层和输出层;行为网络的输入为t时刻的市场状态,输出为估计值Q(x(t),a;θ(t)),利用该估计值结合贪心策略计算得到最优的调价动作,在废旧手机初步估算价值的基础上,综合考虑市场情况完成对手机回收价格的小幅度调整,其中a表示x(t)状态下可选择的调价策略,θ(t)为t时刻行为网络的参数;目标网络的输入为t+1时刻的市场状态,输出为目标值Q(x(t+1),a(t+1);θ
‑
(t+1)),利用该目标值和行为网络的估计值Q(x(t),a;θ(t))计算获得损失函数,并采用梯度下降算法实现价格自适应调整模型的参数更新,其中a(t+1)表示x(t+1)环境状态下可选择的调价策略,θ
‑
(t+1)为t+1时刻目标网络的参数;其中,行为网络的数学描述如下:
①
输入层:该层由i个神经元组成,每个神经元的输出为:u
i
(t)=x
i
(t),(i=1,2,
…
,6)
ꢀꢀꢀꢀ
(1)其中,x
i
(t)为t时刻对应的市场状态,i表示影响手机回收价格的市场因素的个数;x1(t)表示t时刻手机的基础估价;x2(t)表示t时刻的实际成交价格;x3(t)表示t时刻的订单时间;x4(t)表示t时刻的周回收量;x5(t)表示t时刻的最高回收价;x6(t)表示t时刻近期的涨跌幅度;
②
模糊化层:该层中有P个节点,对应的输出隶属度为:其中,为t时刻行为网络模糊化层中第j个神经元的输出隶属度值,j=1,2,
…
,P;c
ij
(t)为t时刻行为网络模糊化层中第j个神经元的第i个隶属度函数的中心;σ
ij
(t)为t时刻行为网络模糊化层中第j个神经元的第i个隶属度函数的宽度;
③
规则层:该层通过与模糊化层的连接来完成模糊规则的匹配,每个神经元的输出为:其中,v
j
(t)为t时刻行为网络规则层中第j个神经元的输出值;P是该层神经元的数量;
④
归一化层:该层每个神经元的输出为:
⑤
输出层:该层输出为t时刻的市场状态下,计算得到的行为网络输出状态值:其中,模型中调价模块的调价策略a分为上调3α%、上调2α%、上调α%、不调整、下调α%、下调2α%和下调3α%,共7种情况,其中α为控制调价幅度的常量;x(t)表示t时刻的环
境状态;Q(x(t),a;θ(t))为x(t)状态下采取调价策略a时对应的行为网络输出状态值;ω
j
(t)为t时刻行为网络归一化层与输出层之间的连接权值;目标网络的数学描述如下:
①
输入层:该层由i个神经元组成,每个神经元的输出为:u
i
′
(t+1)=x
i
(t+1),(i=1,2,
…
,6)
ꢀꢀꢀꢀ
(6)其中,x
i
(t+1)为t+1时刻对应的市场状态;x1(t+1)表示t+1时刻手机的基础估价;x2(t+1)表示t+1时刻的实际成交价格;x3(t+1)表示t+1时刻的订单时间;x4(t+1)表示t+1时刻的周回收量;x5(t+1)表示t+1时刻的最高回收价;x6(t+1)表示t+1时刻近期的涨跌幅度;
②
模糊化层:该层中有P个节点,对应的输出隶属度为:其中,为t+1时刻目标网络模糊化层中第j个神经元的输出隶属度值,j=1,2,
…
,P;c
ij
'(t+1)为t+1时刻目标网络模糊化层中第j个神经元的第i个隶属度函数的中心;σ
ij
'(t+1)为t+1时刻目标网络模糊化层中第j个神经元的第i个隶属度函数的宽度;
③
规则层:该层通过与模糊化层的连接来完成模糊规则的匹配,每个神经元的输出为:其中,v
j
'(t+1)为t+1时刻目标网络规则层中第j个神经元的输出值;P是该层神经元的数量;
④
归一化层:该层每个神经元的输出为:
⑤
输出层:该层输出为t+1时刻的市场状态下,计算得到的目标网络输出状态值:其中,x(t+1)表示t+1时刻的环境状态;a(t+1)表示x(t+1)状态下可选择的调价策略;θ
‑
(t+1)为t+1时刻目标网络的参数;Q(x(t+1),a(t+1);θ
‑
(t+1)...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。