【技术实现步骤摘要】
【国外来华专利技术】事件预测装置、预测模型生成装置以及事件预测用程序
本专利技术涉及事件预测装置、预测模型生成装置以及事件预测用程序,尤其涉及根据包含多个单词的文本的内容来预测特定事件的技术、以及生成使用于该预测的预测模型的技术。
技术介绍
目前,使用人工智能(AI)来预测特定事件的技术正被广泛使用。作为人工智能之一,存在有机器学习。机器学习是试图通过计算机实现与人类进行的学习同样的功能的技术,大致分为监督学习、无监督学习以及强化学习这三种。最广泛普及的监督学习是指:准备带正确解答的多个学习数据,使用其进行学习,由此生成分类模型,基于生成的分类模型对预测对象的数据进行分类。使用什么作为学习数据是多种多样的,但一直以来已知有使用文档数据作为学习数据来进行机器学习的系统(例如,参照专利文献1、2)。在专利文献1中,公开了一种能够从文本数据中容易地发现符合使用者意图的规则性的文本数据分析装置。在该专利文献1所记载的文本数据分析装置中,具备存储对文本进行分类的类别的文本类别存储部、将在作为对象的领域中表示重要概念的单词的集合存储为概念定 ...
【技术保护点】
1.一种事件预测装置,其特征在于,具备:/n单词提取部,该单词提取部对m(m为2以上的任意整数)个文本进行分析并从该m个文本中提取n(n为2以上的任意整数)个单词;/n文本向量计算部,该文本向量计算部通过使所述m个文本分别按照规定的规则在q(q为2以上的任意整数)个维度上向量化,从而计算出由q个轴分量构成的m个文本向量;/n单词向量计算部,该单词向量计算部通过使所述n个单词分别按照规定的规则在q个维度上向量化,从而计算出由q个轴分量构成的n个单词向量;/n指标值计算部,该指标值计算部通过分别获取所述m个文本向量与所述n个单词向量的内积,从而计算出反映所述m个文本和所述n个单 ...
【技术特征摘要】
【国外来华专利技术】20180502 JP 2018-0888291.一种事件预测装置,其特征在于,具备:
单词提取部,该单词提取部对m(m为2以上的任意整数)个文本进行分析并从该m个文本中提取n(n为2以上的任意整数)个单词;
文本向量计算部,该文本向量计算部通过使所述m个文本分别按照规定的规则在q(q为2以上的任意整数)个维度上向量化,从而计算出由q个轴分量构成的m个文本向量;
单词向量计算部,该单词向量计算部通过使所述n个单词分别按照规定的规则在q个维度上向量化,从而计算出由q个轴分量构成的n个单词向量;
指标值计算部,该指标值计算部通过分别获取所述m个文本向量与所述n个单词向量的内积,从而计算出反映所述m个文本和所述n个单词之间的关联度的m×n个相似度指标值;
分类模型生成部,该分类模型生成部使用所述指标值计算部计算出的所述m×n个相似度指标值生成分类模型,其中,所述分类模型用于根据针对一个文本由n个相似度指标值构成的文本指标值组,将所述m个文本分类为多个事件;
预测用数据输入部,该预测用数据输入部将作为预测对象的一个以上文本作为预测用数据而输入;以及
事件预测部,该事件预测部将通过对所述预测用数据输入部输入的所述预测用数据执行所述单词提取部、所述文本向量计算部、所述单词向量计算部以及所述指标值计算部的处理而得到的相似度指标值应用于由所述分类模型生成部生成的分类模型,由此根据所述预测对象数据来预测所述多个事件中的任一个。
2.如权利要求1所述的事件预测装置,其特征在于,
所述文本向量计算部和所述单词向量计算部对于所述m个文本和所述n个单词的全部组合计算出从所述n个单词中的一个单词预测所述m个文本中的一个文本的概率、或者从所述m个文本中的一个文本预测所述n个单词中的一个单词的概率,并将该概率的合计值作为目标变量,计算出使该目标变量最大化的文本向量和单词向量。
3.如权利要求1或2所述的事件预测装置,其特征在于,
所述指标值计算部通过获取以所述m个文本向量的各q个轴分量作为各元素的文本矩阵与以所述n个单词向量的各q个轴分量作为各元素的词矩阵之积,从而计算出以m×n个所述相似度指标值作为各元素的指标值矩阵。
4.如权利要求1至3中任一项所述的事件预测装置,其特征在于,
所述事件预测装置进一步具备学习用数据输入部,该学习用数据输入部将符合所述多个事件中的哪一个为已知的所述m个文本作为学习用数据而输入;
以被所述学习用数据输入部作为所述学习用数据而输入的所述m个文本为对象,执行所述单词提取部、所述文本向量计算部、所述单词向量计算部、所述指标值计算部以及所述分类模型生成部的处理。
5.如权利要求1至4中任一项所述的事件预测装置,其特征在于,
所述事件预测装置进一步具备报酬决定部,该报酬决定部根据相对于所述事件预测部预测出的事件的实际事件,决定提供给所述分类模型生成部的报酬;
所述分类模型生成部根据所述报酬决定部所决定的报酬改变所述分类模型。
6.一种预测模型生成装置,其特征在于,具备:
单词提取部,该单词提取部对m(m为2以上的任意整数)个文本进行分析并从该m个文本中提取n(n...
【专利技术属性】
技术研发人员:丰柴博义,
申请(专利权)人:株式会社FRONTEO,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。