【技术实现步骤摘要】
问答机器人训练方法、系统及问答机器人
本专利技术涉及电路领域,尤其涉及一种问答机器人训练方法、系统及问答机器人。
技术介绍
电商平台中,往往会设置问答机器人,用于解决用户提出的常见问题,在现有的电商平台中,现有客服机器人基本为问答机器人,常见的实现方式如下:1.基于关键词的精确匹配或者模糊匹配;这种方式的机器人非常简单,客户问的问题只能是单个的词汇,而不是复杂的句式,常用语微信公众号平台的一些关键词回复,且经常会出现由于匹配不到相关关键词而导致无法回答的情况。2.对问题和知识库进行分词,对分词结果进行匹配;这种方式的机器人会增强匹配到的题库知识的概率,但是经常会出现“答非所问”的问题。3.利用近期深度学习模型构造监督模型,利用生成模型以及分类模型,但是模型往往无法有效地结合。无法对多模型的样本做针对性分类样本训练。
技术实现思路
本专利技术的目的是针对上述现有技术存在的缺陷,提供一种问答机器人训练方法、系统及问答机器人,以解决现有技术中的问答机器人答题匹配度不高、不够智能的技术问题 ...
【技术保护点】
1.一种问答机器人训练方法,其特征在于,包括:/n对由多个训练样本组成的语义相似度训练数据集进行训练,根据训练样本中的两个训练语句的相似度与所述两个训练语句的相似度标签的交叉熵损失来更新所述训练样本的样本权重,其中,所述相似度训练数据集由多个训练样本组成,每个训练样本包括了两个不同的训练语句以及对两个训练语句设置的相似度标签和样本权重。/n
【技术特征摘要】
1.一种问答机器人训练方法,其特征在于,包括:
对由多个训练样本组成的语义相似度训练数据集进行训练,根据训练样本中的两个训练语句的相似度与所述两个训练语句的相似度标签的交叉熵损失来更新所述训练样本的样本权重,其中,所述相似度训练数据集由多个训练样本组成,每个训练样本包括了两个不同的训练语句以及对两个训练语句设置的相似度标签和样本权重。
2.如权利要求1所述的问答机器人训练方法,其特征在于,具体包括:
对所述语义相似度训练数据集进行训练,得到词向量矩阵和字典向量矩阵;
根据所述词向量矩阵和字典向量矩阵得到每个训练样本中的两个训练语句的综合词向量;
采用设定的训练模型分别对每个训练样本中的两个训练语句的综合词向量进行训练,分别得到两个训练语句的语义向量;
根据所述两个训练语句的语义向量计算所述两个训练语句的相似度;
计算所述两个训练语句的相似度与所述两个训练语句的相似度标签的交叉熵损失,根据所述交叉熵损失得出所述两个训练语句所在的训练样本的样本权重并更新所述样本权重。
3.如权利要求2所述的问答机器人训练方法,其特征在于,对由多个训练样本组成的语义相似度训练数据集进行训练得到词向量矩阵和字典向量矩阵的具体过程包括:
输入语义相似度训练数据集并设置训练样本初始化权重;
在所述语义相似度训练数据集中随机选择设定数量的训练样本进行训练,生成由每一个训练语句分解得到的词组成的词向量矩阵;
将所述语义相似度训练数据集中选择的训练样本中的每一个训练语句转化为字符数据,形成与所述字符数据对应的字典向量矩阵。
4.如权利要求3所述的问答机器人训练方法...
【专利技术属性】
技术研发人员:陈明威,陈功,马雅奇,孙秀丹,仲丽君,
申请(专利权)人:珠海格力电器股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。