一种基于在线社交网络的用户人格识别方法技术

技术编号:33376630 阅读:18 留言:0更新日期:2022-05-11 22:44
本发明专利技术公开了一种基于在线社交网络的用户人格识别方法,包括步骤S001,收集用户在线社交网络的文本数据记忆用户在线行为,步骤S002,对于文字数据要先进行文字的预处理,去除特定的无用符号、数据中非文本部分以及无效的文字,提炼出有效文字和可以表达情感的表情,对于文字部分进行中文分词,将一段文字分开成符合语义的单一词语,达到电脑自动识别语句含义的效果,对于表情类的部分,先做标记与关联的内容,下一步将对其详细处理等。下一步将对其详细处理等。下一步将对其详细处理等。

【技术实现步骤摘要】
一种基于在线社交网络的用户人格识别方法


[0001]本专利技术涉及适用于人格识别
,具体涉及基于在线社交网络的用户人格识别方法。

技术介绍

[0002]人格被概念化为一个人特征的整个心理活动,其中特征被定义为一组跨情景和时间稳定的个体属性,人格是所有属性的综合体(行为、气质、态度、情感和精神);在社交网络上,用户会在他们分享的内容和他们的表达方式上透露很多关于他们自己的信息。通过自我描述、状态更新、照片和兴趣,用户的大部分个性都来自他们的个人资料以及其他的文本信息和用户在线的行为。
[0003]几十年来,心理学研究人员一直致力于系统地了解个性,在开发和验证广泛接受的人格模型的大量工作之后,研究人员已经证明了一般人格特质与许多类型行为之间的联系,所以如何根据用户的文本数据以及在线行为判断用户人格是行业内新出现且亟待解决的问题。

技术实现思路

[0004]针对相关技术中的问题,本专利技术提出一种基于在线社交网络的用户人格识别方法,以克服现有相关技术所存在的上述技术问题。
[0005]为此,本专利技术采用的具体技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于在线社交网络的用户人格识别方法,其特征在于,包括以下步骤,步骤S001,收集用户在线社交网络的文本数据记忆用户在线行为;步骤S002,对于文字数据要先进行文字的预处理,去除特定的无用符号、数据中非文本部分以及无效的文字,提炼出有效文字和可以表达情感的表情,对于文字部分进行中文分词,将一段文字分开成符合语义的单一词语,达到电脑自动识别语句含义的效果,对于表情类的部分,先做标记与关联的内容,下一步将对其详细处理;步骤S003,使用文本分析工具分析文本信息的文字内容,并生成不同文本特征的统计数据,将过程中和人格相关的特征在MRC心理语言学数据库进行测试,输出每个词语的人格分数,最后核算每一句文本基于MRC心理语言学数据库的人格分数;步骤S004,对于步骤S002最后提到的表情类部分,将表情对应的标签特征与相关联句子在步骤S003中得到的语义信息以及人格特征相比较,判断表情属于正相关给文本带来正影响或是负相关给文本带来负影响,得到这段文本数据对应的总体的人格特征数值;步骤S005,计算通过分析文本得到的文本特征与人格特征的匹配程度;步骤S006,对于用户行为特征,通过步骤S001中收集的行为数据,对相关行为产生的人格特征做统计,刻画用户的人格;步骤S007,将通过文本分析得到的人格特征匹配分数和用户行为人格特征的结果综合来判断用户的人格;步骤S008,为了完善最终人格预测系统,需要不断重复步骤S005

S007,并将步骤S007所得的识别结果与传统方法预测的人格进行对比,并进行监督化学习回归分析,得到人格预测模型;步骤S009,采集用户在在线社交网络中发布的文本内容以及用户在线行为特征并输入人格预测模型,便可得到预测的用户人格信息并得出结论。2.根据权利要求1所述的一种基于在线社交网络的用户人格识别方法,其特征在于,步骤S001中的文本数据包括但不限于发过的文章内容,经常使用的词汇,文本的语法结构,关注点赞评论的内容,主题标签的使用以及用户之间社交谈话等...

【专利技术属性】
技术研发人员:董佩昂
申请(专利权)人:上海花事电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1