聊天机器人搜索推荐模型的训练、推荐方法及电子设备技术

技术编号:33997913 阅读:23 留言:0更新日期:2022-07-02 11:21
本申请公开了一种聊天机器人搜索推荐模型的训练方法、推荐方法及电子设备、存储介质,包括:基于多个用户对应的历史行为信息、搜索关键词和候选聊天机器人描述信息,得到对应的初始特征数据;将用户对应的多个历史正向行为作为正样本标签,历史非正向行为作为负样本标签,与初始特征数据进行特征融合,得到每个用户对应的第一特征数据;将第一特征数据分别输入到DBN网络和FM网络,并基于DBN网络的最后一层输出的第二特征数据和FM网络输出的第三特征数据生成第四特征数据;将第四特征数据输入输出层,以对输出层、DBN网络和FM网络的参数进行训练,得到收敛的聊天机器人搜索推荐模型。本申请可以避免过拟合,提高训练模型泛化能力。力。力。

【技术实现步骤摘要】
聊天机器人搜索推荐模型的训练、推荐方法及电子设备


[0001]本申请涉及人工智能
,尤其涉及一种聊天机器人搜索推荐模型的训练方法、聊天机器人搜索推荐方法及电子设备、计算机可读存储介质。

技术介绍

[0002]随着人工智能技术的快速发展,聊天机器人(Chatbot)逐渐普及。Chatbot为5G消息的一种形态,终端用户可以与聊天机器人在5G消息原生对聊页面中进行消息交互。同时,用户可以通过搜索发现需要的Chatbot服务。
[0003]针对聊天机器人搜索推荐场景,需要综合用户的各种行为结果进行最终预测。现有技术针对每个行为的预测需要单独训练学习模型,各个不同行为对应的单一模型必须使用不同的训练数据集,因此模型训练时使用的训练数据量有限,因此非常容易出现过拟合问题,降低模型泛化能力。
[0004]如何避免聊天机器人搜索推荐模型训练过程中存在的过拟合,是目前亟待解决的技术问题。

技术实现思路

[0005]本申请实施例的目的是提供一种聊天机器人搜索推荐模型的训练方法、聊天机器人搜索推荐方法及电子设备、计算机可读存储介质,用以解决现有推荐模型泛化能力低的问题。
[0006]为了解决上述技术问题,本说明书是这样实现的:
[0007]第一方面,提供了一种聊天机器人搜索推荐模型的训练方法,包括:基于多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息,得到所述历史行为信息、搜索关键词和候选聊天机器人描述信息各自对应的初始特征数据;
[0008]将用户对应的多个历史正向行为作为正样本标签,历史非正向行为作为负样本标签,与所述初始特征数据进行特征融合,得到每个用户对应的第一特征数据,其中正向行为类型包括用户点击、交互和关注候选聊天机器人;
[0009]将所述第一特征数据分别输入到DBN网络和FM网络,并基于所述DBN网络的最后一层输出的第二特征数据和所述FM网络输出的第三特征数据生成第四特征数据;
[0010]将所述第四特征数据输入输出层,以对所述输出层、所述DBN网络和FM网络的参数进行训练,得到收敛的聊天机器人搜索推荐模型,其中所述输出层包括与用户多个正向行为一一对应的多个转移矩阵,所述输出层输出所述多个转移矩阵对应的各个候选机器人对用户多个正向行为的预测值及所述初始特征数据中各个特征组合的预测值。
[0011]可选的,所述候选聊天机器人描述信息包括候选聊天机器人的名称、地址、简介、编号、分类、点击热度、交互次数和关注次数;
[0012]所述历史行为信息包括用户ID、用户搜索、点击、投诉、关注候选聊天机器人、与候
选聊天机器人交互的历史行为、用户所有历史行为的次数和用户历史正向行为的次数。
[0013]可选的,基于多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息,得到所述历史行为信息、搜索关键词和候选聊天机器人描述信息各自对应的初始特征数据,包括:
[0014]将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的原始文本信息转换为词向量数据特征的初始特征数据,所述原始文本信息包括候选聊天机器人的名称、地址、简介和用户搜索关键词;
[0015]将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的原始离散数据转换为稀疏数据的初始特征数据,所述原始离散数据特征包括候选聊天机器人编号、分类和用户ID、用户的历史行为;
[0016]将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的数值特征作为所述初始特征数据,所述数值特征包括搜索评分、候选聊天机器人的点击热度、用户所有历史行为的次数和用户历史正向行为的次数。
[0017]可选的,将用户对应的多个历史正向行为作为正样本标签,历史非正向行为作为负样本标签,与所述初始特征数据进行特征融合,得到每个用户对应的第一特征数据,包括:
[0018]将每个用户对应的历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的数值特征与转换后的词向量数据特征、离散数据特征进行特征拼接得到所述第一特征数据。
[0019]可选的,基于所述DBN网络的最后一层输出的第二特征数据和所述FM网络输出的第三特征数据生成第四特征数据,包括:将所述第二特征数据和所述第三特征数据进行特征拼接得到所述第四特征数据。
[0020]可选的,所述DBN网络的最后一层为全连接层,将所述第四特征数据输入输出层,以对所述输出层、所述DBN网络和FM网络的参数进行训练,得到收敛的聊天机器人搜索推荐模型,包括:
[0021]利用所述第四特征数据对所述DBN网络和所述输出层进行训练,直至所述DBN网络和所述输出层的参数收敛,输出各个候选机器人对用户多个正向行为的预测值;
[0022]利用所述第四特征数据对所述FM网络进行训练,直至所述FM网络的参数收敛,输出所述初始特征数据的各个特征组合的预测值;
[0023]将所述各个候选机器人对用户多个正向行为的预测值和所述初始特征数据的各个特征组合的预测值拼接作为所述聊天机器人搜索推荐模型的输出预测值。
[0024]可选的,所述多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息为获取的真实用户数据,利用所述真实用户数据训练的初始的DBN网络、FM网络和输出层为利用预训练特征数据进行预训练后得到的,利用所述预训练特征数据对所述DBN网络、FM网络和输出层进行预训练的步骤与利用所述真实用户数据对所述DBN网络、FM网络和输出层进行训练的步骤相同,所述方法还包括:
[0025]生成所述预训练特征数据以作为用于所述预训练的初始特征数据的步骤,其中,所述预训练特征数据为基于部分的所述真实用户数据生成的无标签的多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息。
[0026]可选的,生成所述预训练特征数据,包括:
[0027]获取预定数量不同维度的真实聊天机器人描述信息特征并进行组合,生成无标签的聊天机器人描述信息,所述聊天机器人描述信息特征包括聊天机器人的名称、地址、简介、编号、分类、点击热度、交互次数和关注次数中的至少一项;
[0028]采样用户的行为类型、聊天机器人编号,并与随机生成的用户ID、用户所有行为的次数和用户正向行为的次数拼接得到所述用户历史行为信息,所述用户的行为类型包括用户搜索、点击、投诉、关注候选聊天机器人以及与候选聊天机器人交互中的至少一项;
[0029]对生成的所述聊天机器人描述信息进行分词处理,得到对应的搜索关键词列表。
[0030]第二方面,提供了一种聊天机器人搜索推荐方法,包括:
[0031]接收用户输入的搜索关键词;
[0032]获取多个候选聊天机器人对应的描述信息、所述用户对应的历史行为信息,并与所述用户输入的搜索关键词拼接得到对应的输入特征数据;
[0033]将所述输入特征数据输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种聊天机器人搜索推荐模型的训练方法,其特征在于,包括:基于多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息,得到所述历史行为信息、搜索关键词和候选聊天机器人描述信息各自对应的初始特征数据;将用户对应的多个历史正向行为作为正样本标签,历史非正向行为作为负样本标签,与所述初始特征数据进行特征融合,得到每个用户对应的第一特征数据,其中正向行为类型包括用户点击、交互和关注候选聊天机器人;将所述第一特征数据分别输入到DBN网络和FM网络,并基于所述DBN网络的最后一层输出的第二特征数据和所述FM网络输出的第三特征数据生成第四特征数据;将所述第四特征数据输入输出层,以对所述输出层、所述DBN网络和FM网络的参数进行训练,得到收敛的聊天机器人搜索推荐模型,其中所述输出层包括与用户多个正向行为一一对应的多个转移矩阵,所述输出层输出所述多个转移矩阵对应的各个候选机器人对用户多个正向行为的预测值及所述初始特征数据中各个特征组合的预测值。2.如权利要求1所述的方法,其特征在于,所述候选聊天机器人描述信息包括候选聊天机器人的名称、地址、简介、编号、分类、点击热度、交互次数和关注次数;所述历史行为信息包括用户ID、用户搜索、点击、投诉、关注候选聊天机器人、与候选聊天机器人交互的历史行为、用户所有历史行为的次数和用户历史正向行为的次数。3.如权利要求1所述的方法,其特征在于,基于多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息,得到所述历史行为信息、搜索关键词和候选聊天机器人描述信息各自对应的初始特征数据,包括:将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的原始文本信息转换为词向量数据特征的初始特征数据,所述原始文本信息包括候选聊天机器人的名称、地址、简介和用户搜索关键词;将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的原始离散数据转换为稀疏数据的初始特征数据,所述原始离散数据特征包括候选聊天机器人编号、分类和用户ID、用户的历史行为;将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的数值特征作为所述初始特征数据,所述数值特征包括搜索评分、候选聊天机器人的点击热度、用户所有历史行为的次数和用户历史正向行为的次数。4.如权利要求3所述的方法,其特征在于,将用户对应的多个历史正向行为作为正样本标签,历史非正向行为作为负样本标签,与所述初始特征数据进行特征融合,得到每个用户对应的第一特征数据,包括:将每个用户对应的历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的数值特征与转换后的词向量数据特征、离散数据特征进行特征拼接得到所述第一特征数据。5.如权利要求1所述的方法,其特征在于,基于所述DBN网络的最后一层输出的第二特征数据和所述FM网络输出的第三特征数据生成第四特征数据,包括:将所述第二特征数据和所述第三特征数据进行特征拼接得到所述第四特征数据。6.如权利要求5所述的方法,其特征在于,所述DBN网络的最后一层为全连接层,将所述
第四特征数据输入输出层,以对所述输出层、所...

【专利技术属性】
技术研发人员:苏国曦胡文辉郑敏吴华挚孙立军谭俊卓彩霞肖献骏陈蕾宇邵韵潮黄世欢陈钊佳冼恩圳郭骏逸姚德生陈炎森农嘉锴王绮媛张强钟夏瑜丁奕洪姚杰林万军陈强庞春凯
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1