一种基于深度学习的用户人格识别方法技术

技术编号:33376620 阅读:82 留言:0更新日期:2022-05-11 22:44
本发明专利技术公开了一种基于深度学习的用户人格识别方法,包括步骤S001,收集用户社交过程中的文本数据以及语音数据,步骤S002,对音频进行预处理并提取信号特征;步骤S003,利用传统方法的人格测试作为标签检验模型准确度,用机器学习/深度学习做回归模型,不断交叉验证和迭代优化模型参数,训练得到人格识别模型等。本发明专利技术高效的、专业化的从日常生活聊天中刻画人的内心,识别人格;利用文本数据以及语音数据基于上下文前后语境识别人格;作为结果可以得出专业的心理学报告。可以得出专业的心理学报告。可以得出专业的心理学报告。

【技术实现步骤摘要】
一种基于深度学习的用户人格识别方法


[0001]本专利技术涉及适用于人格识别
,具体涉及基于深度学习的用户人格识别方法。

技术介绍

[0002]人格被概念化为一个人特征的整个心理活动,其中特征被定义为一组跨情景和时间稳定的个体属性,人格是所有属性的综合体(行为、气质、态度、情感和精神);在社交过程中,用户会通过文本或者音频方式在他们分享的内容和他们的表达方式上透露很多关于他们自己的信息。
[0003]几十年来,心理学研究人员一直致力于系统地了解个性,在开发和验证广泛接受的人格模型的大量工作之后,研究人员已经证明了一般人格特质与许多类型行为之间的联系,所以如何根据用户的聊天文本、音频数据判断用户人格是行业内新出现且亟待解决的问题。

技术实现思路

[0004]针对相关技术中的问题,本专利技术提出一种基于深度学习的用户人格识别方法,以克服现有相关技术所存在的上述技术问题。
[0005]为此,本专利技术采用的具体技术方案如下:
[0006]一种基于深度学习的用户人格识别方法,包括以下步骤,包括以下步骤,步骤S001,收集用户社交过程中的文本数据以及语音数据;
[0007]步骤S002,对音频进行预处理并提取信号特征;
[0008]步骤S003,利用传统方法的人格测试作为标签检验模型准确度,用机器学习/深度学习做回归模型,不断交叉验证和迭代优化模型参数,训练得到人格识别模型;
[0009]步骤S004,将此模型用于产品中,可以通过用户日常的聊天判断用户人格。
[0010]优选的,步骤S002中,先对语音信息进行处理,直接使用基于深度学习的端到端学习,将音频数据投入,输出文本。
[0011]优选的,步骤S002中,对于文字数据和语音信息转换的文本数据要先进行文字的预处理,去除特定的无用符号,去除数据中非文本部分,去除无效的文字,提炼出有效文字;然后进行中文分词,将一段文字分开成符合语义的单一词语,达到自动识别语句含义的效果。
[0012]优选的,在步骤S002中的提取信号特征具体为,利用深度学习算法进行语义语法信息的提取并分类为不同的标签,算法过程中每个词的含义都将联系上下文而进行判断。
[0013]优选的,步骤S003中,首先训练步骤S002中的神经网络模型,利用已有的数据以及传统人工人格测试作为标签投入模型进行训练,通过标签来验证模型的准确性,不断返回误差调整参数,最后将误差收敛在可接受的范围内,得到训练好的模型。
[0014]优选的,通过所述标签判断文本属于哪种,最后基于用户大量文本数据的投入,判
断该用户的聊天习惯更符合于哪种人格,此结果作为文本和音频中语义部分的人格结果。
[0015]优选的,步骤S003中,对于语音部分进行另外的处理,提取音频特征,训练深度学习网络,将以上特征进行标签的分类,得到结果作为音频中音色的人格结果。
[0016]优选的,步骤S004中,结合文本和音频中语义部分的人格结果以及音频中音色的人格结果得出最终的人格报告,提供给用户。
[0017]优选的,步骤S003所述的音频特征包括语调、频率、振幅等物理特征。
[0018]与现有技术相比,本专利技术的有益效果为:
[0019]1、本专利技术的技术使用人格心理学与人工智能相结合识别人格,人工智能代替心理学家做高效率专业化人格识别,大大提升了效率,而且人工智能的提升速度较快,且不受体力等限制。
[0020]2、本专利技术的技术基于用户日常聊天中的文字和音频数据识别用户人格,在行业内属于创举;
[0021]3、本专利技术的技术从日常生活中测试人格,避免主观性和潜意识隐藏人格外部表现,判断结论比较中肯,收集到的用户信息将只用于个人的人格刻画,过程中如需用在其他功能,将会和用户确认。并且将充分保护用户的个人隐私、保障用户的信息安全。
[0022]4、本专利技术的技术能够识别聊天中文本信息和音频信息背后的人格心理学逻辑,模型认识更深刻,判断结果更加真实、深入。
[0023]具体的,本专利技术从用户日常聊天中识别用户人格,可以结合前后语境、用户语音语调、语言声音结构等多个角度判断用户人格;解决人为测试的主观性低效性,并以专业化为基础给客户提供人格测试;基于日常的数据来判断,通过人日常的没有修饰的状态中识别人格。
[0024]综上,本专利技术高效的、专业化的从日常生活聊天中刻画人的内心,识别人格;利用文本数据以及语音数据基于上下文前后语境识别人格;作为结果可以得出专业的心理学报告。
附图说明
[0025]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]图1示出了本申请实施例提出的一种基于深度学习的用户人格识别方法的步骤流程图;
[0027]图2示出了本申请实施例中通过不同的神经网络提取特征的示意图;
[0028]图3示出了本申请实施例中将权值附加到子网后预测输出的示意图。
具体实施方式
[0029]为进一步说明各实施例,本专利技术提供有附图,这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点,图中
的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
[0030]如图1所示,本实施例公开了一种基于深度学习的用户人格识别方法,包括:
[0031]步骤1,首先向收集用户在产品中产生的日常聊天数据,包括语音信息、文字信息,收集到的用户信息将只用于个人的人格刻画,过程中如需用在其他功能,将会和用户确认。并且将充分保护用户的个人隐私、保障用户的信息安全。
[0032]步骤2,先对语音信息进行处理,直接使用基于深度学习的端到端学习,将音频数据投入,输出文本。
[0033]步骤3,对于文字数据和步骤2中的文本数据要先进行文字的预处理,首先去除特定的无用符号去除数据中非文本部分,去除无效的文字,提炼出有效文字。然后进行中文分词,将一段文字分开成符合语义的单一词语,达到自动识别语句含义的效果,例如[机器学习/包含/深度学习]。
[0034]步骤4,文本特征提取:利用深度学习算法如LSTM(也称长短期记忆人工神经网络)进行语义语法信息的提取并分类为不同的标签,算法过程中每个词的含义都将联系上下文而进行判断。
[0035]步骤5,首先训练神经网络模型,利用已有的数据以及传统人工人格测试作为标签投入模型进行训练,通过标签来验证模型的准确性,不断返回误差调整参数,最后将误差收敛在可接受的范围内,得到训练好的模型。
[0036]步骤6,上述步骤5中的标签类似于用户在传统问卷方式下得到的人格结果,例如五大人格的[开放性、责本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的用户人格识别方法,其特征在于,包括以下步骤,步骤S001,收集用户社交过程中的文本数据以及语音数据;步骤S002,对音频进行预处理并提取信号特征;步骤S003,利用传统方法的人格测试作为标签检验模型准确度,用机器学习/深度学习做回归模型,不断交叉验证和迭代优化模型参数,训练得到人格识别模型;步骤S004,将此模型用于产品中,可以通过用户日常的聊天判断用户人格。2.根据权利要求1所述的一种基于深度学习的用户人格识别方法,其特征在于,步骤S002中,先对语音信息进行处理,直接使用基于深度学习的端到端学习,将音频数据投入,输出文本。3.根据权利要求2所述的一种基于深度学习的用户人格识别方法,其特征在于,步骤S002中,对于文字数据和语音信息转换的文本数据要先进行文字的预处理,去除特定的无用符号,去除数据中非文本部分,去除无效的文字,提炼出有效文字;然后进行中文分词,将一段文字分开成符合语义的单一词语,达到自动识别语句含义的效果。4.根据权利要求1

3任一项所述的一种基于深度学习的用户人格识别方法,其特征在于,在步骤S002中的提取信号特征具体为,利用深度学习算法进行语义语法信息的提取并分类为不同的标签,算法过程...

【专利技术属性】
技术研发人员:董佩昂
申请(专利权)人:上海花事电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1