一种基于动态用户画像的个性化对话方法及系统技术方案

技术编号:39651178 阅读:15 留言:0更新日期:2023-12-09 11:19
本发明专利技术公开了一种基于动态用户画像的个性化对话方法,包括:通过实体识别模块识别对话过程中的用户实体,根据用户实体得到与用户实体有关的实体信息,实体关系预测模块对识别到的实体信息进行关系预测,得到实体关系,用户图谱构建模块将接收到的实体关系以三元组的形式存储在图数据库中;通过知识图谱扩展模块引入知识库,根据相关实体信息扩充背景知识,构建基于用户实时更新的知识图谱,用户意图识别模块通过用户的话语,识别出用户的真实意图;通过推理获取用于回复的知识候选信息,对话生成模块将知识候选信息与对话历史信息输入到对话生成网络中,生成并输出对用户的回复

【技术实现步骤摘要】
一种基于动态用户画像的个性化对话方法及系统


[0001]本专利技术涉及人工智能领域,具体是一种基于动态用户画像的个性化对话方法及系统


技术介绍

[0002]对话是人类传递信息和进行交流的一种常见方式,在人类社会中扮演着至关重要的角色

不同的人使用不同的对话方式来达到交流目的,例如获得信息

建立联系

表达情感等

随着信息技术的快速发展和海量数据的涌现,人们期望能够与计算机系统进行更加自然

贴近人类的交互方式
。ChatGPT
的出现,更是大幅度地提升了人机对话的水平

然而,现有的开放领域对话系统,包括
ChatGPT
都缺乏对用户的个性化建模,未能对用户的历史对话信息进行有效提取和充分利用,更没有考虑用户的个性化意图,尤其是隐式意图,导致它们无法使人类保持对话兴趣和建立起持久的联系


技术实现思路

[0003]本专利技术的目的在于克服现有技术的不足,提供一种基于动态用户画像的个性化对话方法,包括如下步骤:
[0004]步骤一,通过实体识别模块识别对话过程中的用户实体,根据用户实体得到与用户实体有关的实体信息,将识别到的实体信息送入实体关系预测模块;
[0005]步骤二,实体关系预测模块对识别到的实体信息进行关系预测,得到实体关系,将预测到的实体和关系送入用户图谱构建模块;
[0006]步骤三,用户图谱构建模块将接收到的实体关系以三元组的形式存储在图数据库中;通过知识图谱扩展模块引入知识库,根据相关实体信息扩充背景知识,构建基于用户实时更新的知识图谱,并把更新后的知识图谱送到知识推理模块;
[0007]步骤四,用户意图识别模块通过用户的话语,识别出用户的真实意图;
[0008]步骤五,将用户的真实意图和用户画像一并输入知识推理模块,通过推理获取用于回复的知识候选信息,并将知识候选信息传递到对话生成模块;
[0009]步骤六,对话生成模块将知识候选信息与对话历史信息输入到对话生成网络中,生成并输出对用户的回复

[0010]进一步的,所述的通过实体识别模块识别对话过程中的用户实体,根据用户实体得到与用户实体有关的实体信息,将识别到的实体信息送入实体关系预测模块,包括:
[0011]实体识别模块根据用户输入的话语文本,使用预训练语言模型
BERT
进行编码,获取字向量,然后输入全连接层获取实体识别的字向量,并通过
CRF
输出实体识别结果

[0012]进一步的,所述的实体关系预测模块对识别到的实体信息进行关系预测,得到实体和关系,将预测到的实体和关系送入用户图谱构建模块,包括:
[0013]实体关系预测模块根据实体识别结果对应的字向量生成实体矩阵,并将实体矩阵输入
Bi

LSTM
处理,得到最后一层的隐藏向量,用一层
LSTM
解码
BiLSTM
编码得到的隐藏向
量,并建模隐藏向量和实体标记之间的关系,得到处理后的向量,通过
softmax
分类器对解码后的向量进行关系分类,结合实体识别结果得到实体关系

[0014]进一步的,所述的用户图谱构建模块将接收到的实体关系以三元组的形式存储在图数据库中,包括:
[0015]将得到的实体关系存储在
neo4j
图数据库中,得到用户的知识图谱,当用户再次输入话语时,抽取出新输入话语的实体关系,同时检索
neo4j
图数据库中是否已经存在实体关系在知识图谱中,若存在,知识图谱将不进行更新,否则新抽取的实体关系更新到用户知识图谱中

[0016]进一步的,所述的通过知识图谱扩展模块引入知识库,根据相关实体信息扩充背景知识,构建基于用户实时更新的知识图谱,并把更新后的知识图谱送到知识推理模块,包括:
[0017]引入外部知识库
ConceptNet
,使用
spaCy
实体链接器匹配用户知识图谱和外部知识库相对应的实体,若含有外部知识信息,将外部知识库中的实体知识信息映射到用户知识图谱中,构成一个时更新识的用户知识图谱,具体包括:当通过实体关系抽取得到一个新的三元组后,使用
spaCy
对得到的尾实体进行实体链接,返回该尾实体在
ConceptNet
中的
ID
,然后使用
Cypher
查询语言获取在
ConceptNet
中与尾实体相关的实体以及关系,得到一个以该尾实体为根节点的子图,将得到的子图添加到用户知识图谱中

[0018]进一步的,所述的用户意图识别模块通过用户的话语,识别出用户的真实意图,包括:采用基于
Prompt learning
和预训练语言模型的意图识别方法对用户的显式或隐式意图进行识别,得到用户的真实意图

[0019]进一步的,所述的将用户的真实意图和用户画像一并输入知识推理模块,通过推理获取用于回复的知识候选信息,包括:
[0020]根据述识别出的用户真实意图进行推理得到用于回复的信息,包括:选取用于回复的实体经过两跳,第一跳从抽取得到的用户实体中选取,第二跳从扩展的实体中选取;使用预训练语言模型
RoBERTa
对用户输入进行编码得到用户输入的表示,将第一跳候选实体和用户输入送到
RoBERTa
模型计算每个实体的权重,选择权重值较高的
k
个实体作为第一跳实体,第二跳的候选实体和用户输入送到
RoBERTa
模型计算每个实体的权重,选择权重值较高的
k
个实体作为第二跳实体

[0021]进一步的,所述的对话生成模块将知识候选信息与对话历史信息输入到对话生成网络中,生成并输出对用户的回复,包括
:
将产生的用户真实意图

第一跳实体

第二跳实体以及用户输入一起送到
GPT2
模型生成响应

[0022]一种基于动态用户画像的个性化对话系统,应用所述的一种基于动态用户画像的个性化对话方法,包括实体识别模块

实体关系预测模块

用户图谱构建模块

知识图谱扩展模块

用户意图识别模块

知识推理模块

对话生成模块和数据获取模块;
[0023]所述的实体识别模块

用户意图识别模块分别与所述的数据获取模块连接;所述的实体识别模块

实体关系预测模块

用户图谱构建模块

...

【技术保护点】

【技术特征摘要】
1.
一种基于动态用户画像的个性化对话方法,其特征在于,包括如下步骤:步骤一,通过实体识别模块识别对话过程中的用户实体,根据用户实体得到与用户实体有关的实体信息,将识别到的实体信息送入实体关系预测模块;步骤二,实体关系预测模块对识别到的实体信息进行关系预测,得到实体关系,将预测到的实体关系送入用户图谱构建模块;步骤三,用户图谱构建模块将接收到的实体关系以三元组的形式存储在图数据库中;通过知识图谱扩展模块引入知识库,根据实体信息扩充背景知识,构建基于用户实时更新的知识图谱,并把更新后的知识图谱送到知识推理模块;步骤四,用户意图识别模块通过用户的对话,识别出用户的真实意图;步骤五,将用户的真实意图和用户画像一并输入知识推理模块,通过推理获取用于回复的知识候选信息,并将知识候选信息传递到对话生成模块;步骤六,对话生成模块将知识候选信息与对话历史信息输入到对话生成网络中,生成并输出对用户的回复
。2.
根据权利要求1所述的一种基于动态用户画像的个性化对话方法,其特征在于,所述的通过实体识别模块识别对话过程中的用户实体,根据用户实体得到与用户实体有关的实体信息,将识别到的实体信息送入实体关系预测模块,包括:实体识别模块根据用户输入的话语文本,使用预训练语言模型
BERT
进行编码,获取字向量,然后输入全连接层获取实体识别的字向量,并通过
CRF
输出实体识别结果
。3.
根据权利要求1所述的一种基于动态用户画像的个性化对话方法,其特征在于,所述的实体关系预测模块对识别到的实体信息进行关系预测,得到实体关系,将预测到的实体关系送入用户图谱构建模块,包括:实体关系预测模块根据实体识别结果对应的字向量生成实体矩阵,并将实体矩阵输入
Bi

LSTM
处理,得到最后一层的隐藏向量,用一层
LSTM
解码
BiLSTM
编码得到的隐藏向量,并建模隐藏向量和实体标记之间的关系,得到处理后的向量,通过
softmax
分类器对解码后的向量进行关系分类,结合实体识别结果得到实体关系
。4.
根据权利要求3所述的一种基于动态用户画像的个性化对话方法,其特征在于,所述的用户图谱构建模块将接收到的实体关系以三元组的形式存储在图数据库中,包括:将得到的实体关系存储在
neo4j
图数据库中,得到用户的知识图谱,当用户再次输入话语时,抽取出新输入话语的实体关系,同时检索
neo4j
图数据库中是否已经存在实体关系在知识图谱中,若存在,知识图谱将不进行更新,否则新抽取的实体关系更新到用户知识图谱中
。5.
根据权利要求4所述的一种基于动态用户画像的个性化对话方法,其特征在于,所述的通过知识图谱扩展模块引入知识库,根据相关实体信息扩充背景知识,构建基于用户实时更新的知识图谱,并把更新后的知识图谱送到知识推理模块,包括:引入外部知识库
ConceptNet
,使用
spaCy
实体链接器匹配用户知识图谱和外部知识库相对应的实体,若含有外部知识信息,将外部知识库中的实体知识信息映射到...

【专利技术属性】
技术研发人员:刘淑华张华禹程焕婷秦念彤杨士豪
申请(专利权)人:东北师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1