【技术实现步骤摘要】
对话机器人的自学习方法、装置、系统、电子设备及介质
本说明书实施例涉及对话机器人
,尤其涉及一种对话机器人的自学习方法、装置、系统、电子设备及介质。
技术介绍
随着移动电子设备的飞速发展,使得移动电子设备上的应用也越来越多,而使用应用的用户也越来越多,而用户在使用应用过程中会存在各种问题均需要解答,而人工解答的效率较低且成本较高,从而出现了对话机器人用于回答用户的提问。现有技术中的对话机器人,通常是在获取用户与机器人的历史对话数据,然后离线对历史对话数据进行清洗计算,分析出对话知识库中未覆盖的问题和问法,然后在对话知识库中更新未覆盖问题的答复方案,使得对话机器人在使用更新后的对话知识库对用户的提问进行答复。
技术实现思路
本说明书实施例提供了一种对话机器人的自学习方法、装置、系统、电子设备及介质,能够快速的完成实时学习,提高机器人自学习的时效性。本说明书实施例第一方面提供了一种对话机器人的自学习方法,包括:通过日志服务实时获取用户提问数据;通过分布式对实时获取 ...
【技术保护点】
1.一种对话机器人的自学习方法,包括:/n通过日志服务实时获取用户提问数据;/n通过分布式对实时获取的用户提问数据执行机器人自学习计算,所述执行机器人自学习计算步骤包括:/n使用局部敏感哈希对所述用户提问数据进行向量化处理,对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集;/n利用所述用户提问数据的提问向量,针对所述提问类簇集构建倒排索引。/n
【技术特征摘要】
1.一种对话机器人的自学习方法,包括:
通过日志服务实时获取用户提问数据;
通过分布式对实时获取的用户提问数据执行机器人自学习计算,所述执行机器人自学习计算步骤包括:
使用局部敏感哈希对所述用户提问数据进行向量化处理,对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集;
利用所述用户提问数据的提问向量,针对所述提问类簇集构建倒排索引。
2.如权利要求1所述的方法,所述使用局部敏感哈希对所述用户提问数据进行向量化处理,对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集,包括:
使用局部敏感哈希对所述用户提问数据进行向量化处理,得到所述用户提问数据的提问向量;
对所述用户提问数据的提问向量进行聚类,得到所述提问类簇集。
3.如权利要求1所述的方法,在对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集之后,所述方法还包括:
针对所述提问类簇集中的每个提问类簇,获取该提问类簇的聚类中心,从该提问类簇中获取离所述聚类中心最近的一个提问向量,并将获取的提问向量作为该提问类簇的中心点。
4.一种对话机器人的自学习方法,包括:
获取当前用户的当前提问数据;
使用局部敏感哈希对所述当前提问数据进行向量化处理,得到所述当前提问数据的提问向量;
根据所述当前提问数据的提问向量和如权利要求1-3任一项所述方法建立的倒排索引,从如权利要求1-3任一项所述方法建立的提问类簇集中获取与所述当前提问数据相似的相似提问类簇;
将所述当前提问数据与所述相似提问类簇中每个提问类簇进行相似度计算,得到与所述当前提问数据匹配的目标提问类簇,其中,所述目标提问类簇与所述当前提问数据的相似度不小于预设相似度;
更新所述目标提问类簇,并根据更新后的所述目标提问类簇,更新所述倒排索引。
5.如权利要求4所述的方法,所述将所述当前提问数据与所述相似提问类簇中每个提问类簇进行相似度计算,包括:
基于SinglePass算法,计算所述当前提问数据与所述相似提问类簇中每个提问类簇的相似度,得到所述当前提问数据与所述相似提问类簇中每个提问类簇的相似度。
6.如权利要求4所述的方法,在更新所述目标提问类簇之后,所述方法还包括:
获取更新后的所述目标提问类簇的聚类中心;
从更新后的所述目标提问类簇中,获取离所述所述目标提问类簇的聚类中心最近的一个提问向量,并将获取的提问向量作为更新后的所述目标提问类簇的中心点。
7.如权利要求6所述的方法,在更新所述目标提问类簇之后,所述方法还包括:
若更新后的所述目标提问类簇的业务参数不小于业务阈值,则更新对话机器人所对应的对话知识库。
8.如权利要求5所述的方法,在将所述当前提问数据与所述相似提问类簇中每个提问类簇进行相似度计算之后,所述方法还包括:
若计算出所述当前提问数据与所述相似提问类簇中任意一个提问类簇的相似度均小于所述预设相似度,则获取与所述当前提问数据相似的相似散点;
对所述当前提问数据和所述相似散点进行聚类计算,得到所述当前提问数据和所述相似散点组成的新提问类簇,并将所述新提问类簇添加到所述提问类簇集中。
9.一种对话机器人的自学习装置,包括:
提问数据获取单元,用于通过日志服务实时获取用户提问数据;
机器人自学习单元,用于通过分布式对实时获取的用户提问数据执行机器人自学习计算,所述执行机器人自学习计算步骤包括:使用局部敏感哈希对所述用户提问数据进行向量化处理,使用局部敏感哈希对所述用户提问数据进行向量化处理,对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集;利用所述用户提问数据的提问向量,针对所述提问类簇集构建倒排索引。
10.如权利要求9所述的装置,所述机器人自学习单元,用于使用局部敏感哈希对所述用户提问数据进行向量化处理,得到所述用户提问数据的提问向量;
对所述用户提问数据的提问向量进行聚类,得到所述提问类簇集。
11.如权利要求9所述的装置,还包括:
类簇...
【专利技术属性】
技术研发人员:吴岳灏,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。