System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度强化学习的高新技术产业化趋势预测方法及系统技术方案_技高网

基于深度强化学习的高新技术产业化趋势预测方法及系统技术方案

技术编号:41155397 阅读:2 留言:0更新日期:2024-04-30 18:20
本发明专利技术提供一种基于深度强化学习的高新技术产业化趋势预测方法及系统,涉及人工智能和机器学习技术领域,该方法包括采集高新技术产业化历史数据;基于改进后的深度强化学习Rainbow算法构建控制器模型;基于大量的历史数据和环境信息,对所述控制器模型进行训练优化;利用优化后的控制器模型对高新技术产业化趋势进行预测。本发明专利技术在高新技术产业化趋势预测方面具有高准确性、自动化和实时性、增强决策效果以及灵活性和适应性等优点,能够为决策者提供科学、全面、准确的预测结果,有助于减少决策风险和提高成功率。

【技术实现步骤摘要】

本专利技术涉及人工智能和机器学习,尤其涉及一种基于深度强化学习的高新技术产业化趋势预测方法及系统


技术介绍

1、现代社会无论是一个国家或地区的产业竞争力,还是一家企业的核心竞争力越来越取决于高新技术产业化水平,因此预测技术产业化趋势就成为决策企业发展、投资和产业政策的关键工作。当前预测技术产业化趋势的方法有多种,常用的方法有如下几种:

2、技术成熟度模型:使用技术成熟度模型,如gartner的技术成熟度曲线,以了解技术的当前状态和预计未来发展。这种模型将技术发展划分为不同阶段,如概念验证、实验室研究、商业应用等,以便预测技术何时可产业化。

3、市场采纳模型:采用市场采纳模型,如everett rogers的创新扩散理论,来分析技术在市场中的采纳过程。了解不同市场段落对于高新技术的接受程度,可以帮助预测技术的产业化趋势。

4、专家意见和共识:定期与领域内的专家、从业者和研究人员进行访谈,以获取他们对技术产业化趋势的观点和建议。专家意见可能提供有价值的信息,特别是在高度专业化的领域。

5、历史数据分析:分析类似技术在过去的产业化历史,以了解技术产业化的关键因素和趋势。这可以包括以往成功和失败案例的分析。

6、投资和资金流动分析:监测与高新
相关的投资和资金流动,以评估市场对技术产业化的兴趣。投资趋势和资金流动可以提供有关技术潜力的线索。

7、技术路线图:创建技术路线图,指导技术的发展和商业化计划。路线图可以帮助企业确定技术产业化的时间表和步骤。

<p>8、市场需求分析:深入了解市场需求,包括目标客户、市场规模、竞争情况和产品市场拟合度。市场需求分析可以帮助确定技术的商业化机会。

9、政策和法规分析:考虑政策和法规的影响。政策支持和法规变化可能会加速或阻碍高新技术的产业化。

10、生产和供应链可行性分析:评估生产和供应链的可行性,包括原材料供应、生产过程和分销网络。这有助于确定技术产业化的可行性和成本。

11、定期监测:技术产业化趋势的预测应该是一个持续的过程,需要定期监测市场、技术和竞争的变化,以适应新信息和情况。

12、尽管上述方法可以对技术产业化趋势预测提供了帮助,但现有的高新技术产业化趋势预测方法还存在一些明显的不足和缺陷,包括以下几个方面:

13、(1)主观性:许多方法依赖于主观判断,如依靠专家意见和共识方法。收集专家意见和共识可能受到主观性的影响,不同专家可能持有不同观点,甚至受到偏见的影响。

14、(2)时间限制:某些评估方法需要较长的时间来执行,如定期监测。在快节奏的商业环境中,时间可能成为一个限制,难以及时获得准确的预测结果。

15、(3)数据质量:数据质量是预测的关键,低质量或不准确的数据可能导致错误的预测结果。在某些情况下,数据可能难以获得或不完整,特别是涉及企业私有信息时,可能难以获取详细的数据。

16、(4)偏向过去:一些方法依赖于历史数据分析、投资和资金流向分析等,将过去的经验作为依据。然而,在高新
,过去的数据可能无法准确反映未来的创新和市场变化。


技术实现思路

1、为此,本专利技术的核心目的是为克服当前方法的不足或缺陷,针对高新技术产业化趋势进行准确的预测与评价。

2、为了实现上述目的,本专利技术实施例提供一种基于深度强化学习的高新技术产业化趋势预测方法,该方法包括:

3、步骤s1:采集高新技术产业化历史数据;

4、步骤s2:基于改进后的深度强化学习rainbow算法构建控制器模型;

5、其中所述改进后的深度强化学习rainbow算法,具体包括:将优先回放缓存机制、双q学习、竞争网络融合到dqn算法基础框架中,得到深度强化学习rainbow算法模型;

6、步骤s3:基于大量的历史数据和环境信息,对所述控制器模型进行训练优化;

7、步骤s4:利用优化后的控制器模型对高新技术产业化趋势进行预测。

8、优选地,在dqn算法基础框架中,dqn算法的每次学习过程包括q值迭代和评价网络训练;

9、其中q值迭代规则如下:

10、

11、公式中,q(st,at;θt)是在该状态st下动作at由评估网络获得的q值;θt用来评估网络的参数;θ-为网络参数,用于目标网络;rt为执行了某一状态st下采取动作at后所得到的回报;α代表学习的速率;γ代表衰减的系数;目标网是学习过程中评估网络的阶段复制,通过两个神经网络共同进行q值的迭代,从而提升迭代的稳定性和收敛的速度;

12、在q值迭代结束后,利用q值与迭代前后的差异,dqn算法对评估网络进行了训练,这种差异被称为时间差分偏差,具体表现如下:

13、

14、式中,t为时间差分偏差值;rt为在状态st下采取动作at后获得的奖励;q(st,at;θt)代表该状态st下的动作at是由评估网络计算出的q值;θt用于对网络参数进行评价;θ-是一个网络参数,专为目标网络设计;γ代表衰减的系数;

15、在评估网络训练期间的损失函数为:

16、l(θt)=t2

17、式中,l(θt)为损失函数;θt为评价网络的网络参数;t为时间差分偏差值。

18、优选地,所述优先回放缓存机制,具体包括:

19、这种优先回放缓存机制是基于样本间的时间差异来决定取样的概率,正如以下公式展示的那样:

20、psam,t∝|t|ω

21、其中,psam,t代表了样本被选中的概率;ω为了更好地调整时间差分偏差对抽样概率产生的影响,也就是我们所说的影响系数;t代表时间的差分偏差值;在优先回放缓存机制中,通过从时间差分偏差值偏离较大的样本中抽取更多信息,加速算法的收敛速度,并减少评估网络收敛性所需的样本数量。

22、优选地,所述双q学习,具体包括:

23、使用双神经网络对q值的迭代规律进行了优化,成功消除了“过度估计”的问题,并将迭代过程中的时间差分偏差计算步骤进行了调整:

24、

25、式中,q(st,at;θt)代表该状态st下的动作at是由评估网络计算出的q值;θt用于对网络参数进行评价;θ-是一个网络参数,专为目标网络设计;γ代表衰减的系数;t为时间差分偏差值;rt为在状态st下采取动作at后获得的奖励。

26、优选地,所述竞争网络,具体包括:

27、所述竞争网络改善了评估网络的输出层,从而可以用更精细的方式来表达q值,在这种情况下,经过优化的评价网络拥有两条输出支路,分别是基于当前状态的价值ν(st)和每个动作在此状态下的相对优势e(st,at),最后,得到的q值计算公式是:

28、

29、式中,|a|为动作空间中可行动作的个数;q(st,at)为经改进后的评价网络得出的在状态st下动作at本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,在DQN算法基础框架中,DQN算法的每次学习过程包括Q值迭代和评价网络训练;

3.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,所述优先回放缓存机制,具体包括:

4.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,所述双Q学习,具体包括:

5.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,所述竞争网络,具体包括:

6.根据权利要求5所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,改进的Rainbow深度强化学习算法的行动选择策略,具体包括:

7.一种基于深度强化学习的高新技术产业化趋势预测系统,其特征在于,所述系统用于实现权利要求1至6任意一项所述的基于深度强化学习的高新技术产业化趋势预测方法,具体包括:

8.根据权利要求7所述的基于深度强化学习的高新技术产业化趋势预测系统,其特征在于,所述改进后的深度强化学习Rainbow算法,具体包括:

9.一种高新技术产业化趋势预测装置,其特征在于,所述装置包括处理器、存储器和总线系统,所述处理器和存储器通过该总线系统相连,所述存储器用于存储指令,所述处理器用于执行存储器存储的指令,以实现权利要求1至6任意一项所述的基于深度强化学习的高新技术产业化趋势预测方法。

10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机软件产品,所述计算机软件产品包括的若干指令,用以使得一台计算机设备执行权利要求1至6任意一项所述的基于深度强化学习的高新技术产业化趋势预测方法。

...

【技术特征摘要】

1.一种基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,在dqn算法基础框架中,dqn算法的每次学习过程包括q值迭代和评价网络训练;

3.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,所述优先回放缓存机制,具体包括:

4.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,所述双q学习,具体包括:

5.根据权利要求1所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,所述竞争网络,具体包括:

6.根据权利要求5所述的基于深度强化学习的高新技术产业化趋势预测方法,其特征在于,改进的rainbow深度强化学习算法的行动选择策略,具体包括:

7.一种基于深度强...

【专利技术属性】
技术研发人员:仓剑田闯闯
申请(专利权)人:无锡行行智研科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1