基于知识图谱和大语言模型的用户心理画像系统及方法技术方案

技术编号:38999434 阅读:13 留言:0更新日期:2023-10-07 10:31
本发明专利技术属于电子信息中的数据处理技术领域,具体为一种基于知识图谱和大语言模型的用户心理画像系统及方法,包括:用户交互模块,用于用户与访谈数据模块进行交互;访谈数据模块,访谈数据模块包括访谈语料库和心理量表模块;自然语言处理模块,用于对用户输入的自然语言数据进行处理;知识图谱模块,用于包含关于各种有关心理疾病的知识图谱;用户心理特征模块,用于接收自然语言处理模块与知识图谱模块数据进行比对分析;用户画像模块,根据用户心理特征模块打上的特征标签,进行用户画像;本系统的方法包括六个步骤。本发明专利技术用于解决提高用户心理画像的效率和效果问题。高用户心理画像的效率和效果问题。高用户心理画像的效率和效果问题。

【技术实现步骤摘要】
基于知识图谱和大语言模型的用户心理画像系统及方法


[0001]本专利技术属于电子信息中的数据处理
,具体为一种基于知识图谱和大语言模型的用户心理画像系统及方法。

技术介绍

[0002]用户心理画像是一种通过分析用户的心理特征,如情绪、思维、行为等,来描绘用户的心理状态和倾向的方法。用户心理画像可以帮助医生、心理咨询师、教育工作者等了解用户的心理需求和问题,从而提供更有效的评估和干预。
[0003]目前,用户心理画像的方法主要有以下几种:基于问卷或访谈的方法:这种方法是通过让用户填写一些标准化的心理量表或进行结构化的访谈,来获取用户的心理特征信息。这种方法的优点是比较标准化和专业化,可以得到一些可量化的指标,如抑郁程度、焦虑程度等。但是这种方法的缺点是比较单一和静态,不能充分捕捉用户的多样性和动态性,也不能反映用户的真实情况,因为用户可能会有社会期望效应或回答不真实等问题。
[0004]基于自然语言处理的方法:这种方法是通过对用户输入的自然语言数据,如文本、语音等,进行处理,来提取用户的情绪和主题信息。这种方法的优点是比较自然和动态,可以捕捉用户在不同场景和时间下的心理变化,也可以反映用户的真实情况,因为用户可能会在自然语言中表达出他们不愿意在问卷或访谈中说出的内容。但是这种方法的缺点是比较复杂和不准确,因为自然语言处理涉及到很多难以解决的问题,如语义理解、情感识别、话题发现等,而且自然语言数据本身也可能存在噪声、歧义、隐喻等问题。
[0005]基于多模态数据的方法:这种方法是通过对用户输入的多模态数据,如音频、视频、图像等,进行处理,来提取用户的言行举止、肢体动作、思维活跃度、语言连贯性、面部表情、语音语调等信息。这种方法的优点是比较丰富和全面,可以从多种角度和多个维度来分析用户的心理特征,也可以增加数据的可信度和可解释性,因为多模态数据可以相互验证和补充。但是这种方法的缺点是比较复杂和高成本,因为多模态数据处理涉及到很多难以解决的问题,如数据同步、数据融合、数据表示等,而且多模态数据本身也需要更多的存储空间和计算资源。
[0006]以上各种方法都有其优缺点,但都没有充分利用最新的人工智能技术来提高用户心理画像的效率和效果。例如:知识图谱是一种用于表示结构化知识的图形模型,包含了实体、关系、属性等元素,并以三元组(主体

谓词

宾语)的形式表示这些元素之间的事实。知识图谱可以用于存储和查询与心理疾病相关的知识,如不同类型的疾病、症状、原因、治疗方案等,并通过本体建模来定义这些知识之间的语义关联。知识图谱可以帮助系统更好地理解用户输入的自然语言数据和多模态数据,以及提供更准确和专业的用户心理画像分析结果。
[0007]大语言模型是一种基于深度学习的自然语言生成技术,可以根据给定的输入参数,如文本、图像、音频等,生成相应的自然语言输出,如文本、图像、音频等。大语言模型可
以用于获取用户心理画像分析结果,如用户的心理特征、疾病风险、治疗建议等,并通过微调训练来适应不同的领域和场景。大语言模型可以帮助系统更好地生成用户心理画像报告,以及提供更自然和有趣的用户交互体验。
[0008]因此,有必要开发一种基于知识图谱和大语言模型的用户心理画像系统及方法,以提高用户心理画像的效率和效果。

技术实现思路

[0009]针对以上问题,本专利技术提供一种基于知识图谱和大语言模型的用户心理画像系统及方法,用于解决提高用户心理画像的效率和效果问题。
[0010]为实现上述目的,本专利技术采用的技术方案是:一种基于知识图谱和大语言模型的用户心理画像系统,包括:用户交互模块,用于用户与访谈数据模块进行交互,并将交互得到的数据传给自然语言处理模块;访谈数据模块,访谈数据模块包括访谈语料库和心理量表模块,用于提供用于用户互动的语料库和量表;自然语言处理模块,用于对用户输入的自然语言数据进行处理,包括词性分类、分词、归一化基础任务,以及主题建模、情感分析高级任务;知识图谱模块,用于包含关于各种有关心理疾病的知识图谱,包括不同的疾病类型、症状;用户心理特征模块,用于接收自然语言处理模块与知识图谱模块数据进行比对分析,分析用户的心理特征,包括情绪状态、思维模式、行为模式,并按照用户不同的维度特征打上特征标签;用户画像模块,根据用户心理特征模块打上的特征标签,进行用户画像,用于展示用户的心理画像报告,包括用户的心理特征、疾病风险;大语言模型API接口模块,大语言模型API接口模块与用户交互模块、访谈数据模块、自然语言处理模块、知识图谱模块进行数据互通。
[0011]在较佳实施情况下,所述的用户交互模块还用于根据用户的输入和反馈,动态调整访谈数据模块中的语料库和量表,以提高用户体验和互动效果,其中所述的动态调整采用基于强化学习的算法,根据用户的输入和反馈与访谈数据模块中的语料库和量表之间的相似度进行奖励或惩罚,以优化访谈数据模块中的语料库和量表的选择,其中所述的相似度计算采用余弦相似度公式:其中表示用户的输入和反馈向量,表示访谈数据模块中的语料库和量表向量。
[0012]在较佳实施情况下,所述的自然语言处理模块还用于对用户输入的自然语言数据进行语义理解和意图识别,以便更准确地分析用户的心理状态和需求,其中所述的语义理解采用基于神经网络的模型,将用户输入的自然语言数据转换为语义向量,并与预定义的语义类别进行匹配,其中所述的意图识别采用基于条件随机场的模型,将用户输入的自然语言数据划分为不同的意图标签,并与预定义的意图类别进行匹配。
[0013]在较佳实施情况下,所述的用户心理特征模块用于接收自然语言处理模块与知识
图谱模块数据进行比对分析,其中所述的比对分析采用基于注意力机制Attention模型,将用户输入的自然语言数据、自然语言处理模块传来的数据、知识图谱模块传来的数据、大语言模型API接口模块传来的数据进行融合,并计算不同数据之间的相关性权重,其中所述的相关性权重计算采用点积注意力Attention公式:其中表示查询向量,表示键向量,表示值向量,表示向量维度。
[0014]在较佳实施情况下,所述的大语言模型API接口模块还用于与其他第三方平台进行数据共享和交互,以便扩大用户群体和服务范围,其中所述的数据共享和交互采用基于区块链的技术,将用户输入的自然语言数据、自然语言处理模块传来的数据、知识图谱模块传来的数据、用户心理特征模块传来的数据、用户画像报告数据进行加密和分布式存储,并通过智能合约实现数据的安全和有效的传输和访问。
[0015]一种基于知识图谱和大语言模型的用户心理画像方法,包括以下步骤:a)通过用户交互模块与用户进行交互,并将交互得到的数据传给自然语言处理模块;b)通过自然语言处理模块对用户输入的自然语言数据进行处理,并将处理结果传给知识图谱模块;c)通过知识图谱模块对用户输入的自然语言数据进行匹配和查询,并将匹配和查询结果传给用户心理特征模块;d)通过用户心理特征模块对用户输入的自然语言数据进行比对分析,并将比对分析结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱和大语言模型的用户心理画像系统,其特征在于,包括:用户交互模块,用于用户与访谈数据模块进行交互,并将交互得到的数据传给自然语言处理模块;访谈数据模块,访谈数据模块包括访谈语料库和心理量表模块,用于提供用于用户互动的语料库和量表;自然语言处理模块,用于对用户输入的自然语言数据进行处理,包括词性分类、分词、归一化基础任务,以及主题建模、情感分析高级任务;知识图谱模块,用于包含关于各种有关心理疾病的知识图谱,包括不同的疾病类型、症状;用户心理特征模块,用于接收自然语言处理模块与知识图谱模块数据进行比对分析,分析用户的心理特征,包括情绪状态、思维模式、行为模式,并按照用户不同的维度特征打上特征标签;用户画像模块,根据用户心理特征模块打上的特征标签,进行用户画像,用于展示用户的心理画像报告,包括用户的心理特征、疾病风险;大语言模型API接口模块,大语言模型API接口模块与用户交互模块、访谈数据模块、自然语言处理模块、知识图谱模块进行数据互通。2.根据权利要求1所述的一种基于知识图谱和大语言模型的用户心理画像系统,其特征在于,所述的用户交互模块还用于根据用户的输入和反馈,动态调整访谈数据模块中的语料库和量表,以提高用户体验和互动效果,其中所述的动态调整采用基于强化学习的算法,根据用户的输入和反馈与访谈数据模块中的语料库和量表之间的相似度进行奖励或惩罚,以优化访谈数据模块中的语料库和量表的选择,其中所述的相似度计算采用余弦相似度公式:其中表示用户的输入和反馈向量,表示访谈数据模块中的语料库和量表向量。3.根据权利要求1所述的一种基于知识图谱和大语言模型的用户心理画像系统,其特征在于,所述的自然语言处理模块还用于对用户输入的自然语言数据进行语义理解和意图识别,以便更准确地分析用户的心理状态和需求,其中所述的语义理解采用基于神经网络的模型,将用户输入的自然语言数据转换为语义向量,并与预定义的语义类别进行匹配,其中所述的意图识别采用基于条件随机场的模型,将用户输入的自然语言数据划分为不同的意图标签,并与预定义的意图类别进行匹配。4.根据权利要求1所述的一种基于知识图谱和大语言模型的用户心理画像系统,其特征在于,所述的用户心理特征模块用于接收自然语言处理模块与知识图谱模块数据进行比对分析,其中所述的比对分析采用基于注意力机制Attention模型,将用户输入的自然语言数据、自然语言处理模块传来的数据、知识图谱模块传来的数据、大语言模型API接口模块传来的数据进行融合,并计算不同数据之间的相关性权重,其中所述的相关性权重计算采用点积注意力Attention公式:其中表示查询向量,表示键向量,表示值向量,表示向量维度。
5.根据权利要求1所述的一种基于知识图谱和大语言模型的用户心理画像系统,其特征在于,所述的大语言模型API接口模块还用于与其他第三方平台进行数据共享和交互,以便扩大用户群体和服务范围,其中所述的数据共享和交互采用基于区块链的技术,将用户输入的自然语言数据、自然语言处理模块传来的数据、知识图谱模块传来的数据、用户心理特征模块...

【专利技术属性】
技术研发人员:龙海文建全彭炜黄刊迪杨文君肖媛甘元茂任强文舸扬虞敏
申请(专利权)人:湖南创星科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1