基于长短时记忆神经网络的人体活动类型分类方法及系统技术方案

技术编号:21479076 阅读:46 留言:0更新日期:2019-06-29 05:08
本发明专利技术公开了一种本发明专利技术提出了一种基于长短时记忆神经网络的人体活动类型分类方法及系统。针对以往的点评网站只考虑点评的具体内容和事物,而忽略了不同评论背后的人群所处的活动类型的问题,本发明专利技术提出了一种word2vec模型与TF‑IDF相结合的方法,来推断和识别点评网站上发出不同评论的人当前所处的活动类型和状态。利用评网站构建点评数据集,包括点评内容和活动类型的标签,用Word2Vec模型得到上述点评内容的词向量表示;其次,用TF‑IDF计算每个活动分类的关键词,构建关键词词典;接着,通过统计每条评论中的单词在词典中是否出现,构建权重矩阵;最后将点评内容的词向量与权重矩阵进行拼接,然后输入到长短时记忆神经网络中进行训练,从而得到人体活动分类模块。

【技术实现步骤摘要】
基于长短时记忆神经网络的人体活动类型分类方法及系统
本专利技术涉及数据分析领域,更具体地说,涉及一种基于长短时记忆神经网络的人体活动类型分类方法及系统。
技术介绍
随着计算机网络的不断发展,人们从互联网获得信息的同时,也直接或者间接的在各种网络平台上发表大量的评论信息。这些评论信息表达了各种各样的内容,同时也在背后反映了发表出这些评论的人当前所处的活动状态。比如吃饭,旅行,购物,或是进行娱乐活动等。对这些评论所表达的内容进行分析,可以了解发出评论的人当前的活动类型,同时也可以大概推断评论人当前所处的活动场所。例如网友在点评网站上发表了一条美食的评论,就可以基本推断出该网友正在进行“吃饭”这项活动,同时也可以大概判断该网友当前所处的活动场所是“饭店”。同时,将一个人在一段时间内的评论进行分析,就可以推测出这个人的基本活动类型的转变和活动轨迹的变化。在大量的用户位置和行为轨迹数据的背后,隐含了丰富的空间结构信息和用户行为规律信息。通过对这些信息进行深入的挖掘和利用,不仅可能发现个体用户的日常行为规律和群体用户的共性行为特征,甚至还可能掌握其社交关系信息。这对智能交通,广告推荐等具有重要的本文档来自技高网...

【技术保护点】
1.一种基于长短时记忆神经网络的人体活动类型分类方法,其特征在于,包含如下步骤:S1、从点评网站收集不同类别的点评数据,并对每条点评数据构造活动标签,形成数据集;每个活动标签对应一种人体活动类型;S2、对所述数据集进行数据预处理,去除数据中的噪声;S3、利用TF‑IDF方法从所述数据集中提取每一人体活动类型的关键词,构建出一个包含各个人体活动类型的关键词词典;S4、利用向量生成模型得到点评数据的向量表示;S5、统计每条点评数据中在不同人体活动类型中分别包含关键词的个数,以构建权重矩阵;S6、分别将每条点评数据的权重矩阵和向量表示对应地进行拼接,每条点评数据拼接后形成一个拼接后矩阵;S7、将每个...

【技术特征摘要】
1.一种基于长短时记忆神经网络的人体活动类型分类方法,其特征在于,包含如下步骤:S1、从点评网站收集不同类别的点评数据,并对每条点评数据构造活动标签,形成数据集;每个活动标签对应一种人体活动类型;S2、对所述数据集进行数据预处理,去除数据中的噪声;S3、利用TF-IDF方法从所述数据集中提取每一人体活动类型的关键词,构建出一个包含各个人体活动类型的关键词词典;S4、利用向量生成模型得到点评数据的向量表示;S5、统计每条点评数据中在不同人体活动类型中分别包含关键词的个数,以构建权重矩阵;S6、分别将每条点评数据的权重矩阵和向量表示对应地进行拼接,每条点评数据拼接后形成一个拼接后矩阵;S7、将每个拼接后矩阵和对应的活动标签作为一个训练数据,所有的训练数据一起形成训练集输入到基于长短时记忆神经网络进行训练,得到人体活动类型分类模型,得到的人体活动类型用于对待处理的点评数据进行分类,得到人体活动类型。2.根据权利要求1所述的基于长短时记忆神经网络的人体活动类型分类方法,其特征在于,步骤S2中,所述数据预处理还包括:将连接在一起的单词和标点符号用空格进行分割。3.根据权利要求1所述的基于长短时记忆神经网络的人体活动类型分类方法,其特征在于,步骤S4中:向量表示为1*N的向量,N为大于1的正整数且大于人体活动类型的个数M;步骤S5中:一条点评数据中分别有k1、k2、…、kM个关键词在关键词词典的第一种人体活动类型里、第二种人体活动类型里、…、第M种人体活动类型里,则权重矩阵为[k1,k2,…,kP,0,0,…,0];其中,kM之后的0的个数为N-M,以将权重矩阵扩展为1*N的向量;步骤S6中:选取每条点评数据的前N个词,将每个词的向量表示作为一行进行拼接,形成一个N*N大小的矩阵,再将权重矩阵作为最后一行,形成一个(N+1)*N大小的矩阵作为最终的拼接矩阵;或者,选取每条点评数据的前N个词,将每个词的向量表示作为一列进行拼接,形成一个N*N大小的矩阵,再将权重矩阵作为最后一列,形成一个N*(N+1)大小的矩阵作为最终的拼接矩阵。4.根据权利要求1所述的基于长短时记忆神经网络的人体活动类型分类方法,其特征在于,步骤S4中,所述向量生成模型是指Word2Vec模型。5.根据权利要求1所述的基于长短时记忆神经网络的人体活动类型分类方法,其特征在于,所述点评网站具体是指Yelp点评网站。6.一种基于长短时记忆神经网络的人体活动类型分类系统...

【专利技术属性】
技术研发人员:龚君芳李润佳梁庆中郑坤姚宏刘超董理君康晓军李新川
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1