业务导图中更新节点的方法和装置制造方法及图纸

技术编号:20866686 阅读:22 留言:0更新日期:2019-04-17 09:23
本说明书实施例提供一种业务导图中更新节点的方法和装置,方法包括:获取原始问句构成的第一问句集合;根据第一指令将多个节点中的一个节点确定为待更新节点;根据第二指令确定筛选节点集合;从第一问句集合中筛选出包含筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合;对于第二问句集合中的每个问句进行分词处理,并刨除筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合;根据备选词集合中包括的分词,对第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合;根据候选词集合进行节点更新,从而提升效率。

【技术实现步骤摘要】
业务导图中更新节点的方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及业务导图中更新节点的方法和装置。
技术介绍
业务导图是一种为了进一步提升客服机器人识别准确率而提出的一种算法框架。业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题。在业务导图的构建过程中,需要基于用户问句更新节点,也就是说进行节点挖掘,例如,在业务导图的已有节点下面再增加新增子节点,或者,在业务导图的已有节点下面增加关键词的关联表达。现有技术中,首先基于句子相似度的聚类方法对多个用户问句进行聚类,得到多个聚类簇,然后由人工审核多个聚类簇,人工确定是否存在新节点。由于句子相似度的聚类方法中,句子相似度受句子的文本内容影响大,句子的长短对句子相似度的影响也很大,从而导致同一标准问题的不同表达会被聚类到不同的簇中,这就会导致会有很多重复聚类簇,而聚类簇需要人工审核,重复聚类簇过多过散会导致人工成本上升,效率低。因此,希望能有改进的方案,能够在业务导图中更新节点时提升效率。
技术实现思路
本说明书一个或多个实施例描述了一种业务导图中更新节点的方法和装置,能够在业务导图中更新节点时提升效率。第一方面,提供了一种业务导图中更新节点的方法,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题,方法包括:获取原始问句构成的第一问句集合;接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点;接收第二指令,根据所述第二指令确定筛选节点集合;从所述第一问句集合中筛选出包含所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合;对于所述第二问句集合中的每个问句进行分词处理,并刨除所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合;根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合;接收第三指令,根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达;或者,接收第四指令,根据所述第四指令确定所述待更新节点的已有子节点,并将所述第四指令所指示的所述候选词集合中的至少一个候选词确定为所述已有子节点的关键词的关联表达。在一种可能的实施方式中,所述根据所述第二指令确定筛选节点集合,包括:根据所述第二指令,确定所述待更新节点的路径中的至少一个节点;将所述待更新节点和所述至少一个节点构成的集合作为所述筛选节点集合。在一种可能的实施方式中,所述根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合,包括:对所述备选词集合中包括的分词进行词频统计,获取词频大于预设阈值的高频词;将包括同一高频词的问句划分为一个类别的问句,以及将该高频词作为该类别对应的候选词加入候选词集合。进一步地,所述方法还包括:将所述候选词集合中的各候选词按照词频由高到低顺序展示。在一种可能的实施方式中,所述根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合,包括:对所述备选词集合中包括的分词进行基于密度的聚类统计,得到多个聚类簇;将包括同一聚类簇中任一分词的问句划分为一个类别的问句,以及将该聚类簇的中心词作为该类别对应的候选词加入候选词集合。进一步地,所述方法还包括:将所述候选词集合中的各候选词按照相应类别的密度由高到低顺序展示。在一种可能的实施方式中,所述根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达之后,所述方法还包括:接收第五指令,根据所述第五指令确定所述新增子节点为叶节点,并为该叶节点挂载与该叶节点的关键词相关联的标准问题。在一种可能的实施方式中,所述根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达之后,所述方法还包括:接收第六指令,根据所述第六指令确定所述新增子节点不为叶节点;执行所述接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点,其中,所述待更新节点为所述新增子节点。第二方面,提供了一种业务导图中更新节点的装置,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题,装置包括:获取单元,用于获取原始问句构成的第一问句集合;确定单元,用于接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点;接收第二指令,根据所述第二指令确定筛选节点集合;筛选单元,用于从所述获取单元获取的第一问句集合中筛选出包含所述确定单元确定的筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合;分词单元,用于对于所述筛选单元得到的第二问句集合中的每个问句进行分词处理,并刨除所述确定单元确定的筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合;聚类单元,用于根据所述分词单元得到的备选词集合中包括的分词,对所述筛选单元得到的第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合;节点更新单元,用于接收第三指令,根据所述第三指令为所述确定单元确定的待更新节点增加新增子节点,并将所述第三指令所指示的所述聚类单元得到的候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达;或者,接收第四指令,根据所述第四指令确定所述待更新节点的已有子节点,并将所述第四指令所指示的所述候选词集合中的至少一个候选词确定为所述已有子节点的关键词的关联表达。第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。通过本说明书实施例提供的方法和装置,首先获取原始问句构成的第一问句集合,然后接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点,并接收第二指令,根据所述第二指令确定筛选节点集合,再从所述第一问句集合中筛选出包含所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合,接下来对于所述第二问句集合中的每个问句进行分词处理,并刨除所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合,再根据所述备选词集合中包括的分词,对所述第二问句集合中的包本文档来自技高网...

【技术保护点】
1.一种业务导图中更新节点的方法,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题,所述方法包括:获取原始问句构成的第一问句集合;接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点;接收第二指令,根据所述第二指令确定筛选节点集合;从所述第一问句集合中筛选出包含所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合;对于所述第二问句集合中的每个问句进行分词处理,并刨除所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合;根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合;接收第三指令,根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达;或者,接收第四指令,根据所述第四指令确定所述待更新节点的已有子节点,并将所述第四指令所指示的所述候选词集合中的至少一个候选词确定为所述已有子节点的关键词的关联表达。...

【技术特征摘要】
1.一种业务导图中更新节点的方法,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的叶节点挂载与该叶节点的关键词相关联的标准问题,所述方法包括:获取原始问句构成的第一问句集合;接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点;接收第二指令,根据所述第二指令确定筛选节点集合;从所述第一问句集合中筛选出包含所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达的问句,得到第二问句集合;对于所述第二问句集合中的每个问句进行分词处理,并刨除所述筛选节点集合中每个节点对应的关键词或该关键词的关联表达,得到备选词集合;根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合;接收第三指令,根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达;或者,接收第四指令,根据所述第四指令确定所述待更新节点的已有子节点,并将所述第四指令所指示的所述候选词集合中的至少一个候选词确定为所述已有子节点的关键词的关联表达。2.如权利要求1所述的方法,其中,所述根据所述第二指令确定筛选节点集合,包括:根据所述第二指令,确定所述待更新节点的路径中的至少一个节点;将所述待更新节点和所述至少一个节点构成的集合作为所述筛选节点集合。3.如权利要求1所述的方法,其中,所述根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合,包括:对所述备选词集合中包括的分词进行词频统计,获取词频大于预设阈值的高频词;将包括同一高频词的问句划分为一个类别的问句,以及将该高频词作为该类别对应的候选词加入候选词集合。4.如权利要求3所述的方法,其中,所述方法还包括:将所述候选词集合中的各候选词按照词频由高到低顺序展示。5.如权利要求1所述的方法,其中,所述根据所述备选词集合中包括的分词,对所述第二问句集合中的包括该分词的问句进行聚类处理,得到多个类别的问句以及各类别对应的中心词构成的候选词集合,包括:对所述备选词集合中包括的分词进行基于密度的聚类统计,得到多个聚类簇;将包括同一聚类簇中任一分词的问句划分为一个类别的问句,以及将该聚类簇的中心词作为该类别对应的候选词加入候选词集合。6.如权利要求5所述的方法,其中,所述方法还包括:将所述候选词集合中的各候选词按照相应类别的密度由高到低顺序展示。7.如权利要求1所述的方法,其中,所述根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达之后,所述方法还包括:接收第五指令,根据所述第五指令确定所述新增子节点为叶节点,并为该叶节点挂载与该叶节点的关键词相关联的标准问题。8.如权利要求1所述的方法,其中,所述根据所述第三指令为所述待更新节点增加新增子节点,并将所述第三指令所指示的所述候选词集合中的至少一个候选词确定为所述新增子节点对应的关键词或该关键词的关联表达之后,所述方法还包括:接收第六指令,根据所述第六指令确定所述新增子节点不为叶节点;执行所述接收第一指令,根据所述第一指令将所述多个节点中的一个节点确定为待更新节点,其中,所...

【专利技术属性】
技术研发人员:胡翔石志伟张望舒
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1