一种基于文本游戏的强化学习情感分析系统技术方案

技术编号：28499150 阅读：17 留言：0更新日期：2021-05-19 22:38

本申请涉及内在激励强化学习领域，特别涉及一种基于文本游戏的强化学习情感分析系统，包括如下模块：表示状态的文本描述模块、情绪分析模块、外部环境模块和LSTM

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本游戏的强化学习情感分析系统

[0001]本专利技术涉及内在激励强化学习领域，具体涉及一种基于文本游戏的强化学习情感分析系统。

技术介绍

[0002]目前虽然强化学习(RL)在自然语言处理(NLP)领域取得了成功，如对话生成和基于文本的游戏，但它通常面临的问题是稀疏奖励，导致收敛速度慢或没有收敛。使用文本描述来提取状态表示的传统方法忽略了其中固有的反馈。
[0003]强化学习在处理基于文本游戏时常常面临着奖励稀疏的问题而且强化学习一直依赖于固有奖励在处理本身环境奖励稀疏的问题上存在着处理效果不好的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种基于文本游戏的强化学习情感分析系统。
[0005]为实现上述目的，本专利技术提供如下技术方案：一种基于文本游戏的强化学习情感分析系统，包括：文本描述模块、情绪分析模块、外部环境模块和LSTM
‑
DQN模型模块；
[0006]文本描述模块用于作为表示状态的文本描述的输入模块；表示状态包含积极轨迹和消极轨迹；
[0007]情绪分析模块用于分析文本描述模块中的积极轨迹和消极轨迹，生成基于情感的奖励；
[0008]外部环境模块用于给出外部环境的奖励；
[0009]LSTM
‑
DQN模型模块用于对文本描述模块中文本描述的状态表示进行编码，使用外部环境的奖励，并从状态表示中提取基于情感的奖励作为补充。
[0010]进一步的，所述情绪分析模块中，根据文本描述的情...

【技术保护点】

【技术特征摘要】
1.一种基于文本游戏的强化学习情感分析系统，其特征在于，包括：文本描述模块、情绪分析模块、外部环境模块和LSTM
‑
DQN模型模块；文本描述模块用于作为表示状态的文本描述的输入模块；表示状态包含积极轨迹和消极轨迹；情绪分析模块用于分析文本描述模块中的积极轨迹和消极轨迹，生成基于情感的奖励；外部环境模块用于给出外部环境的奖励；LSTM
‑
DQN模型模块用于对文本描述模块中文本描述的状态表示进行编码，使用外部环境的奖励，并从状态表示中提取基于情感的奖励作为补充。2.根据权利要求1所述的一种基于文本游戏的强化学习情感分析系统，其特征在于，所述情绪分析模块中，根据文本描述的情绪将游戏轨迹划分为赢或输，学习速率在{1
×
10
‑
6、1
×
10
‑
5、2
×
10
‑
5、1
×
10
‑
4}之间变化，训练epoch数在500～1500之间变化，最终的模型以2
×
10
‑
5的学习率训...

【专利技术属性】
技术研发人员：潘晓光，焦璐璐，令狐彬，宋晓晨，韩丹，
申请(专利权)人：山西三友和智慧信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人