聊天机器人搜索推荐模型的训练、推荐方法及电子设备技术

技术编号：33997913 阅读：23 留言：0更新日期：2022-07-02 11:21

本申请公开了一种聊天机器人搜索推荐模型的训练方法、推荐方法及电子设备、存储介质，包括：基于多个用户对应的历史行为信息、搜索关键词和候选聊天机器人描述信息，得到对应的初始特征数据；将用户对应的多个历史正向行为作为正样本标签，历史非正向行为作为负样本标签，与初始特征数据进行特征融合，得到每个用户对应的第一特征数据；将第一特征数据分别输入到DBN网络和FM网络，并基于DBN网络的最后一层输出的第二特征数据和FM网络输出的第三特征数据生成第四特征数据；将第四特征数据输入输出层，以对输出层、DBN网络和FM网络的参数进行训练，得到收敛的聊天机器人搜索推荐模型。本申请可以避免过拟合，提高训练模型泛化能力。力。力。

全部详细技术资料下载

【技术实现步骤摘要】
聊天机器人搜索推荐模型的训练、推荐方法及电子设备

[0001]本申请涉及人工智能
，尤其涉及一种聊天机器人搜索推荐模型的训练方法、聊天机器人搜索推荐方法及电子设备、计算机可读存储介质。

技术介绍

[0002]随着人工智能技术的快速发展，聊天机器人(Chatbot)逐渐普及。Chatbot为5G消息的一种形态，终端用户可以与聊天机器人在5G消息原生对聊页面中进行消息交互。同时，用户可以通过搜索发现需要的Chatbot服务。
[0003]针对聊天机器人搜索推荐场景，需要综合用户的各种行为结果进行最终预测。现有技术针对每个行为的预测需要单独训练学习模型，各个不同行为对应的单一模型必须使用不同的训练数据集，因此模型训练时使用的训练数据量有限，因此非常容易出现过拟合问题，降低模型泛化能力。
[0004]如何避免聊天机器人搜索推荐模型训练过程中存在的过拟合，是目前亟待解决的技术问题。

技术实现思路

[0005]本申请实施例的目的是提供一种聊天机器人搜索推荐模型的训练方法、聊天机器人搜索推荐方法及电子设备、计算机可读存储介质，用以解决现有推荐模型泛化能力低的问题。
[0006]为了解决上述技术问题，本说明书是这样实现的：
[0007]第一方面，提供了一种聊天机器人搜索推荐模型的训练方法，包括：基于多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息，得到所述历史行为信息、搜索关键词和候选聊天机器人描述信息各自对应的初始特征数据；
[00...

【技术保护点】

【技术特征摘要】
1.一种聊天机器人搜索推荐模型的训练方法，其特征在于，包括：基于多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息，得到所述历史行为信息、搜索关键词和候选聊天机器人描述信息各自对应的初始特征数据；将用户对应的多个历史正向行为作为正样本标签，历史非正向行为作为负样本标签，与所述初始特征数据进行特征融合，得到每个用户对应的第一特征数据，其中正向行为类型包括用户点击、交互和关注候选聊天机器人；将所述第一特征数据分别输入到DBN网络和FM网络，并基于所述DBN网络的最后一层输出的第二特征数据和所述FM网络输出的第三特征数据生成第四特征数据；将所述第四特征数据输入输出层，以对所述输出层、所述DBN网络和FM网络的参数进行训练，得到收敛的聊天机器人搜索推荐模型，其中所述输出层包括与用户多个正向行为一一对应的多个转移矩阵，所述输出层输出所述多个转移矩阵对应的各个候选机器人对用户多个正向行为的预测值及所述初始特征数据中各个特征组合的预测值。2.如权利要求1所述的方法，其特征在于，所述候选聊天机器人描述信息包括候选聊天机器人的名称、地址、简介、编号、分类、点击热度、交互次数和关注次数；所述历史行为信息包括用户ID、用户搜索、点击、投诉、关注候选聊天机器人、与候选聊天机器人交互的历史行为、用户所有历史行为的次数和用户历史正向行为的次数。3.如权利要求1所述的方法，其特征在于，基于多个用户对应的历史行为信息、搜索关键词和多个候选聊天机器人对应的候选聊天机器人描述信息，得到所述历史行为信息、搜索关键词和候选聊天机器人描述信息各自对应的初始特征数据，包括：将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的原始文本信息转换为词向量数据特征的初始特征数据，所述原始文本信息包括候选聊天机器人的名称、地址、简介和用户搜索关键词；将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的原始离散数据转换为稀疏数据的初始特征数据，所述原始离散数据特征包括候选聊天机器人编号、分类和用户ID、用户的历史行为；将所述历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的数值特征作为所述初始特征数据，所述数值特征包括搜索评分、候选聊天机器人的点击热度、用户所有历史行为的次数和用户历史正向行为的次数。4.如权利要求3所述的方法，其特征在于，将用户对应的多个历史正向行为作为正样本标签，历史非正向行为作为负样本标签，与所述初始特征数据进行特征融合，得到每个用户对应的第一特征数据，包括：将每个用户对应的历史行为信息、搜索关键词和候选聊天机器人描述信息中包括的数值特征与转换后的词向量数据特征、离散数据特征进行特征拼接得到所述第一特征数据。5.如权利要求1所述的方法，其特征在于，基于所述DBN网络的最后一层输出的第二特征数据和所述FM网络输出的第三特征数据生成第四特征数据，包括：将所述第二特征数据和所述第三特征数据进行特征拼接得到所述第四特征数据。6.如权利要求5所述的方法，其特征在于，所述DBN网络的最后一层为全连接层，将所述
第四特征数据输入输出层，以对所述输出层、所...

【专利技术属性】
技术研发人员：苏国曦，胡文辉，郑敏，吴华挚，孙立军，谭俊，卓彩霞，肖献骏，陈蕾宇，邵韵潮，黄世欢，陈钊佳，冼恩圳，郭骏逸，姚德生，陈炎森，农嘉锴，王绮媛，张强，钟夏瑜，丁奕洪，姚杰，林万军，陈强，庞春凯，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人