一种利用新闻评论行为的网络用户人格自动识别方法技术

技术编号:22076013 阅读:54 留言:0更新日期:2019-09-12 14:14
本发明专利技术公开一种利用新闻评论行为的网络用户人格自动识别方法:步骤一、利用新闻语料资源,对每个新闻文本内容进行中文分词;筛选掉停用词后得到该语料库的所有不同的词条,作为新闻内容词典;步骤二、利用机器学习方法,建立新闻评论行为到人格的预测模型;步骤三、在得到预测模型之后,针对新的网络用户,获得该新的网络用户参与评论的所有新闻,采用获得归一化之后的自变量,利用训练得到的模型实现对网络用户人格的自动识别。本发明专利技术对人格的自动识别,无需用户自我报告,时效性高;对用户没有任何干扰,生态效度高;可以做到大规模用户人格的自动识别;人格识别效率提高;满足在新闻网站场景下对人员人格特征的监测要求。

An Automatic Personality Recognition Method for Web Users Using News Comment Behavior

【技术实现步骤摘要】
一种利用新闻评论行为的网络用户人格自动识别方法
本专利技术涉及一种利用新闻评论行为的网络用户人格自动识别方法,尤其是一种利用网络用户在新闻网站上的新闻评论行为,通过训练及其学习方法建立网络用户的人格预测模型,实现对网络用户人格特征的自动识别的方法;属于计算网络心理学

技术介绍
“人格”(personality)是心理科学领域中的重要研究课题。作为一种特质型心理变量,人格涵盖了个体稳定的行为模式与内部心理过程,能够科学地解释存在于人际之间的稳定的个性化差异,并且能够与“个体”、“人际”、“社会”等多个层面上的变量保持着稳定的预测关系,是心理学一个基础的研究范畴。近年来,研究者们在人格描述模式上形成了比较一致的共识,提出了人格的大五模式,发现大约有五种特质可以涵盖人格描述的所有方面,包括开放性、尽责性、外倾性、宜人性和神经质。传统的人格测量方式主要通过自陈量表的方式,指按照需要测量的人格特征编写与之相对应的客观问题,然后要求被试根据自己的实际情况或感受填写量表,从而最终对用户的人格进行测定的一种测量方法。这在某些情况下是可行的,但是一则用户有的时候很难准确报告自己当前的状态,另本文档来自技高网...

【技术保护点】
1.一种利用新闻评论行为的网络用户人格自动识别方法,其特征在于:该方法步骤如下:步骤一、利用新闻语料资源,对每个新闻文本内容进行中文分词;筛选掉停用词后得到该语料库的所有不同的词条,作为新闻内容词典;步骤二、利用机器学习方法,建立新闻评论行为到人格的预测模型;步骤三、在得到预测模型之后,针对新的网络用户,获得该新的网络用户参与评论的所有新闻,采用获得归一化之后的自变量,利用训练得到的模型实现对网络用户人格的自动识别。

【技术特征摘要】
1.一种利用新闻评论行为的网络用户人格自动识别方法,其特征在于:该方法步骤如下:步骤一、利用新闻语料资源,对每个新闻文本内容进行中文分词;筛选掉停用词后得到该语料库的所有不同的词条,作为新闻内容词典;步骤二、利用机器学习方法,建立新闻评论行为到人格的预测模型;步骤三、在得到预测模型之后,针对新的网络用户,获得该新的网络用户参与评论的所有新闻,采用获得归一化之后的自变量,利用训练得到的模型实现对网络用户人格的自动识别。2.根据权利要求1所述的一种利用新闻评论行为的网络用户人格自动识别方法,其特征在于:所述步骤二具体包括如下步骤:首先,在新闻网站上...

【专利技术属性】
技术研发人员:刘春阳王鹏张旭张翔宇陈志鹏李磊王利军
申请(专利权)人:国家计算机网络与信息安全管理中心北京天润基业科技发展股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1