【技术实现步骤摘要】
业务导图中更新节点的方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及业务导图中更新节点的方法和装置。
技术介绍
业务导图是一种为了进一步提升客服机器人识别准确率而提出的一种算法框架。业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题。在业务导图的构建过程中,需要基于用户问句更新节点,也就是说进行节点挖掘,例如,在业务导图的已有节点下面再增加新增子节点,或者,在业务导图的已有节点下面增加关键词的关联表达。现有技术中,首先基于句子相似度的聚类方法对多个用户问句进行聚类,得到多个聚类簇,然后由人工审核多个聚类簇,人工确定是否存在新节点。由于句子相似度的聚类方法中,句子相似度受句子的文本内容影响大,句子的长短对句子相似度的影响也很大,从而导致同一标准问题的不同表达会被聚类到不同的簇中,这就会导致会有很多重复聚类簇,而聚类簇需要人工审核,重复聚类簇过多过散会导致人工成本上升,效率低。因此,希望能有改进的方案,能够在业务导图中更新节点时提升效率。
技术实现思路
本说明书一个或多个实施例描述了一种业务导图中更新节点的方法和装置,能够在业务导图中更新节点时提升效率。第一方面,提供了一种业务导图中更新节点的方法,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题,方法包括:获取原始问句构成的第一问句集合;接收第一指令,根据所述第一指令将所述多个节点中 ...
【技术保护点】
1.一种业务导图中更新节点的方法,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题,所述方法包括:获取原始问句构成的第一问句集合;接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点;接收第二指令,根据所述第二指令确定筛选节点集合;从所述第一问句集合中筛选出包含所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合;对于所述第二问句集合中的每个问句进行分词处理,并刨除所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合;根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合;接收第三指令,根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达;或者,接收第四指令,根据所述第四指令确定所述待更新节点的已有子节点,并将所述第 ...
【技术特征摘要】
1.一种业务导图中更新节点的方法,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题,所述方法包括:获取原始问句构成的第一问句集合;接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点;接收第二指令,根据所述第二指令确定筛选节点集合;从所述第一问句集合中筛选出包含所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合;对于所述第二问句集合中的每个问句进行分词处理,并刨除所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合;根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合;接收第三指令,根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达;或者,接收第四指令,根据所述第四指令确定所述待更新节点的已有子节点,并将所述第四指令所指示的所述候选词集合中的至少一个候选词确定为所述已有子节点的关键词的关联表达。2.如权利要求1所述的方法,其中,所述根据所述第二指令确定筛选节点集合,包括:根据所述第二指令,确定所述待更新节点的路径中的至少一个节点;将所述待更新节点和所述至少一个节点构成的集合作为所述筛选节点集合。3.如权利要求1所述的方法,其中,所述根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合,包括:对所述备选词集合中包括的分词进行词频统计,获取词频大于预设阈值的高频词;将包括同一高频词的问句划分为一个类别的问句,以及将该高频词作为该类别对应的候选词加入候选词集合。4.如权利要求3所述的方法,其中,所述方法还包括:将所述候选词集合中的各候选词按照词频由高到低顺序展示。5.如权利要求1所述的方法,其中,所述根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合,包括:对所述备选词集合中包括的分词进行基于密度的聚类统计,得到多个聚类簇;将包括同一聚类簇中任一分词的问句划分为一个类别的问句,以及将该聚类簇的中心词作为该类别对应的候选词加入候选词集合。6.如权利要求5所述的方法,其中,所述方法还包括:将所述候选词集合中的各候选词按照相应类别的密度由高到低顺序展示。7.如权利要求1所述的方法,其中,所述根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达之后,所述方法还包括:接收第五指令,根据所述第五指令确定所述新增子节点为叶节点,并为该叶节点挂载与该叶节点的关键词相关联的标准问题。8.如权利要求1所述的方法,其中,所述根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达之后,所述方法还包括:接收第六指令,根据所述第六指令确定所述新增子节点不为叶节点;执行所述接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点,其中,所...
【专利技术属性】
技术研发人员:胡翔,石志伟,张望舒,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。