一种基于大语言模型文本增强的人格检测方法技术

技术编号:42120812 阅读:12 留言:0更新日期:2024-07-25 00:39
本发明专利技术公开了一种基于大语言模型文本增强的人格检测方法,属于人格检测技术领域,能够解决现有方法缺乏训练数据支持,且对用户人格的分类过于绝对,导致人格检测模型性能低下的问题。所述方法包括:S1、利用大语言模型对训练数据集中每个用户的每个初始文本进行分析,生成多个分析文本;S2、利用多个分析文本和训练数据集训练小语言模型和分类器;S3、利用训练后的小语言模型和分类器进行人格检测。本发明专利技术用于人格检测。

【技术实现步骤摘要】

本专利技术涉及一种基于大语言模型文本增强的人格检测方法,属于人格检测。


技术介绍

1、人格检测通过对个人发布的信息进行分析,来识别隐藏在这些信息中的人格特征并确定个人的人格类型。个人发布的信息通常为文本形式,比如个人在社交媒体上发布的帖子。目前,人格检测领域主要使用自陈量表的方式来收集个人文本和真实人格类型,但由于自陈量表的收集耗时且易引发用户关于隐私的担忧,使用自陈量表收集到的用户真实信息十分有限,导致人格检测模型的构建缺乏大量训练数据的支持。因此,目前的人格检测方法大多采用现有的预训练小语言模型进行人格检测,该方法基于有限的训练数据,通过监督学习对预训练小语言模型进行微调,以使预训练小语言模型能够直接获取待检测文本中的人格特征,并根据人格特征与人格标签输出人格检测结果。

2、但是,训练数据较少往往导致预训练小语言模型的微调效果有效,使得预训练小语言模型提取人格特征的准确性较差,进而影响预训练小语言模型的检测性能。此外,现有方法通常以独热编码来表示代表人格类型的人格标签,导致模型对用户人格的分类过于绝对,造成检测结果偏离真实情况。

...

【技术保护点】

1.一种基于大语言模型文本增强的人格检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述分析文本包括语义分析信息、情感分析信息和语言分析信息。

3.根据权利要求1所述的方法,其特征在于,所述S2具体为:

4.根据权利要求3所述的方法,其特征在于,所述S21具体为:

5.根据权利要求4所述的方法,其特征在于,所述确定多个正样本对和多个负样本对,具体为:

6.根据权利要求4所述的方法,其特征在于,每个用户对应有多个初始文本;

7.根据权利要求3所述的方法,其特征在于,所述S22具体为:...

【技术特征摘要】

1.一种基于大语言模型文本增强的人格检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述分析文本包括语义分析信息、情感分析信息和语言分析信息。

3.根据权利要求1所述的方法,其特征在于,所述s2具体为:

4.根据权利要求3所述的方法,其特征在于,所述s21具体为:

5.根据权利要求4所述的方法,其特征在于,所述确定多个正样本对和多个负样本对,具体为:

【专利技术属性】
技术研发人员:胡琳梅何鸿宇王翔宇李奕霖谈晓强
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1