【技术实现步骤摘要】
一种确定突发问题的方法及装置
本说明书涉及数据处理
,特别涉及一种确定突发问题的方法及装置。
技术介绍
目前,在用户提问日益增长的背景下,现有技术中均预存有标准问题以及对于标准问题的回复内容,如果用户提出的问题为标准问题,就可以自动获得回复。但是对于突发问题,并没有预存的回复内容。如何快速地发现突发问题,并进一步回复突发问题,对于提升用户体验显得格外重要。针对突发问题的发现,现有技术中一般是通过热词批次来发现一些用户求助上涨的问题,然后人工确定突发问题。此种发现突发问题的方式覆盖能力弱,对线上实际问题的解决情况提升较小,用户体验不佳。
技术实现思路
有鉴于此,本说明书实施例提供了一种确定突发问题的方法及装置,以解决现有技术中存在的技术缺陷。本说明书实施例公开了一种确定突发问题的方法,包括:获取用户的访问量大于第一阈值的提问问句;将所述提问问题与问句历史库进行匹配,得到筛选问句集;将所述提问问句与所述筛选问句集中的问句分别进行相似度计算;若相似度小于第二阈值,则根据所述提问问句生成突发问题;若相似度大于等于第二阈值且用户的访问量大于第三阈值,则根据所述提问问句在预 ...
【技术保护点】
1.一种确定突发问题的方法,其特征在于,包括:获取用户的访问量大于第一阈值的提问问句;将所述提问问句与问句历史库进行匹配,得到筛选问句集;将所述提问问句与所述筛选问句集中的问句分别进行相似度计算;若相似度小于第二阈值,则根据所述提问问句生成突发问题;若相似度大于等于第二阈值且用户的访问量大于第三阈值,则根据所述提问问句在预存的标准问题库中查找对应的标准问题,并确定该标准问题为突发问题,其中,所述第三阈值大于第一阈值。
【技术特征摘要】
1.一种确定突发问题的方法,其特征在于,包括:获取用户的访问量大于第一阈值的提问问句;将所述提问问句与问句历史库进行匹配,得到筛选问句集;将所述提问问句与所述筛选问句集中的问句分别进行相似度计算;若相似度小于第二阈值,则根据所述提问问句生成突发问题;若相似度大于等于第二阈值且用户的访问量大于第三阈值,则根据所述提问问句在预存的标准问题库中查找对应的标准问题,并确定该标准问题为突发问题,其中,所述第三阈值大于第一阈值。2.如权利要求1所述的确定突发问题的方法,其特征在于,将所述提问问句与问句历史库进行匹配,得到筛选问句集,包括:将所述提问问句转换为多维向量,并将所述多维向量散列化;将散列化的所述多维向量与问句历史库的问句向量进行比对,并根据比对的结果得到对应的筛选问句集。3.如权利要求1所述的确定突发问题的方法,其特征在于,根据所述提问问句生成突发问题,包括:将所述提问问句输入至聚类模型进行聚类计算,并根据聚类计算的结果得到所述提问问句对应的突发问题。4.如权利要求3所述的确定突发问题的方法,其特征在于,在根据所述提问问句生成突发问题后,还包括:将所述突发问题进行审核处理,并为审核处理后的所述突发问题配置对应的答案;将所述突发问题及其对应的答案写入标准问题库,并将所述突发问题的答案推送给用户。5.如权利要求1所述的确定突发问题的方法,其特征在于,每个所述标准问题对应于至少一个标准问句;根据所述提问问句在预存的标准问题库中查找对应的标准问题,包括:将所述提问问句与所述标准问句进行匹配,根据匹配到的标准问句在预存的标准问题库查找对应的标准问题。6.如权利要求1所述的确定突发问题的方法,其特征在于,所述标准问题库中存储有至少一个标准问题以及每个所述标准问题对应的答案;在确定该标准问题为突发问题的情况下,还包括:在预存的标准问题库中查找所述标准问题对应的答案,并将查找到的答案推送给用户。7.如权利要求4所述的确定突发问题的方法,其特征在于,将所述提问问句输入至聚类模型进行聚类计算,并根据聚类计算的结果得到所述提问问句对应的突发问题,包括:将所述提问问句与垃圾问句库中的垃圾问句进行匹配,并剔除与所述垃圾问句库相匹配的提问问句,得到清洁的提问问句;其中,所述垃圾问句库内预存有至少一条垃圾问句;将所述清洁的提问问句输入至聚类模型进行聚类计算,得到聚类计算的结果;确定所述聚类计算的结果是否与已有的突发问题相对应;若是,则将与所述聚类计算的结果对应的所述清洁的提问问句写入所述对应的突发问题;否则,新建突发问题,并将与所述聚类计算的结果对应的所述清洁的提问问句写入所述新建的突发问题。8.如权利要求4所述的确定突发问题的方法,其特征在于,所述审核处理包括:将所述突发问题进行合并;和/或将所述突发问题进行打散。9.如权利要求7所述的确定突发问题的方法,其特征在于,所述审核处理包括:将所述突发问题内的至少一个提问问句标记为垃圾问句,并将所述垃圾问句写入至所述垃圾问句库中。10.如权利要求4所述的确定突发问题的方法,其特征在于,还包括:将所述审核处理的结果作为训练数据写入至所述聚类模型,以训练所述聚类模型。11.如权利要求3所述的确定突发问题的方法,其特征在于,所述聚类模型包括:Single-Pass单遍算法模型或K-means均值算法模型。12.一种确定突发问题的装置,其特征在于,包括:提问问句获取模块,被配置为获取用户的访问量大于第一阈值的提问问句;匹配模块,被配置为将所述提问问句与问句历史库进行匹配,得到筛选问句集;相似度计算模块,被配置为将所述提问问句与所述筛选问句集中的问句分别进行相似度计算;突发问题生成模块,被配置为若相似度小于第二阈值,则根据所述提问问句生成突发问题;突发问题查找模块,被配置为若相似度大于等于第二阈值且用户的访问量大于第三阈值,则根据所述提问问句在预存的标准问题库中查找对应的标准问题,并确定该标准问题为突发问题,其中...
【专利技术属性】
技术研发人员:赖晓虎,彭玉军,毛佩瑶,吴岳灏,温祖杰,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。