信息处理装置、信息处理方法以及存储介质制造方法及图纸

技术编号：29403739 阅读：27 留言：0更新日期：2021-07-23 22:42

实施方式涉及信息处理装置、信息处理方法以及存储介质。信息处理装置具备：序列预测部，使用对一个输入数据输出L个分类分布的序列即分类分布列的预测模型，取得与第一输入数据对应的第一分类分布列、以及与所述第一输入数据的附近的第二输入数据对应的第二分类分布列；距离计算部，针对i＝1～L分别计算所述第一分类分布列中的第i个分类分布与所述第二分类分布列中的第i个分类分布之间的分布间距离；合并部，计算L个所述分布间距离的总和；以及优化部，以使所述总和变小的方式更新所述预测模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理装置、信息处理方法以及存储介质
实施方式涉及信息处理装置、信息处理方法以及存储介质。
技术介绍
为了预测模型的泛化性能提高、半监督学习(semi-supervisedLearning)，已知有如下方法：以使学习数据及其附近点处的后验概率分布的分布间距离最小化的方式更新预测模型的参数，从而使后验概率分布平滑化。后验概率分布是指对某一输入附带了条件的输出的概率分布。后验概率分布为平滑的状态是指，当两个数据在数据空间较近时，与它们对应的事后概率也类似的状态。但是，该方法在处理序列数据的情况下，分布间距离的计算负载变高，处理需要大量的时间。因此，对于处理序列数据的预测模型，要求能够以更少的计算量进行后验概率分布的平滑化，从而实现泛化性能提高、半监督学习。
技术实现思路
本实施方式要解决的课题在于，提供一种能够以较少的计算量对处理序列数据的预测模型进行后验概率分布的平滑化的信息处理装置、信息处理方法以及程序。实施方式的信息处理装置具备序列预测部、距离计算部、合并部、以及优化部。序列预测部使用...

【技术保护点】
1.一种信息处理装置，具备：/n序列预测部，使用对一个输入数据输出L个分类分布的序列即分类分布列的预测模型，取得与第一输入数据对应的第一分类分布列、以及与所述第一输入数据的附近的第二输入数据对应的第二分类分布列，其中，L为2以上的自然数；/n距离计算部，针对i＝1～L分别计算所述第一分类分布列中的第i个分类分布与所述第二分类分布列中的第i个分类分布之间的分布间距离；/n合并部，计算L个所述分布间距离的总和；以及/n优化部，以使所述总和变小的方式更新所述预测模型的参数。/n

【技术特征摘要】
1.一种信息处理装置，具备：
序列预测部，使用对一个输入数据输出L个分类分布的序列即分类分布列的预测模型，取得与第一输入数据对应的第一分类分布列、以及与所述第一输入数据的附近的第二输入数据对应的第二分类分布列，其中，L为2以上的自然数；
距离计算部，针对i＝1～L分别计算所述第一分类分布列中的第i个分类分布与所述第二分类分布列中的第i个分类分布之间的分布间距离；
合并部，计算L个所述分布间距离的总和；以及
优化部，以使所述总和变小的方式更新所述预测模型的参数。

2.如权利要求1所述的信息处理装置，
所述预测模型使用递归神经网络而构成，该递归神经网络包含在所输出的所述分类分布列中邻接的分类分布彼此相互带来影响的递归的结合。

3.如权利要求1或2所述的信息处理装置，
所述优化部使用概率梯度法，以使所述总和变小的方式更新所述预测模型的参数。

4.如权利要求1至3中任一项所述的信息处理装置，
所述第二输入数据是在输入数据空间中从所述第一输入数据离开了规定距离的数据。

5.如权利要求4所述的信息处理装置，
所述第二输入数据是在输入数据空间中从所述第一输入数据离开了规定距离的数据中的、所述总和成为最大的数据。

6.如权利要求1至3中任一项所述的信息处理装置，
在将所述预测模型的学习中所使用的多个学习数据中的与所述第一输入数据第t接近的学习数...

【专利技术属性】
技术研发人员：田中辽平，
申请(专利权)人：株式会社东芝，东芝数字解决方案株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人