对话流程图生成方法及相关装置制造方法及图纸

技术编号:38002576 阅读:22 留言:0更新日期:2023-06-30 10:16
本发明专利技术公开了对话流程图生成方法及相关装置,可以通过将对话文本拆分成多段文本,并为各段文本设置相应的标签,从而得到标签序列,其中,标签序列包括多个文本节点,一个文本节点对应一段文本;将标签序列输入至隐马尔可夫模型进行无监督学习,从而得到隐马尔科夫模型的一组模型参数,其中,模型参数包括多个隐状态、各隐状态之间的转移概率矩阵,每个隐状态均包括至少一个显状态以及该隐状态到所包括的各显状态之间的发射概率矩阵,一个显状态对应一个文本节点;根据隐状态、显状态、转移概率矩阵和发射概率矩阵,基于图算法,生成相应的对话流程图。本发明专利技术不依赖人的经验,自动生成的对话流程图,比较客观准确,且覆盖比较全面。面。面。

【技术实现步骤摘要】
对话流程图生成方法及相关装置


[0001]本专利技术涉及大数据领域,特别涉及一种对话流程图生成方法及相关装置。

技术介绍

[0002]在电话客服的人工外呼或者机器外呼领域,需要对各项业务场景的对话流程做设计和优化,传统的做法时需要依赖专家经验和人工处理,流程的初始设计受专家的经验和思维模式的局限性,很难保证其客观性和全面性。

技术实现思路

[0003]鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的对话流程图生成方法及相关装置。
[0004]第一方面,一种对话流程图生成方法,包括:
[0005]将对话文本拆分成多段文本,并建立各段所述文本确定对应的标签,从而得到标签序列,其中,所述标签序列包括多个文本节点,一个所述文本节点对应一段所述文本,一个所述文本节点对应至少一个所述标签;
[0006]将所述标签序列输入至隐马尔可夫模型进行无监督学习,从而得到隐马尔科夫模型的一组模型参数,其中,所述模型参数包括多个隐状态、各所述隐状态之间的转移概率矩阵,每个所述隐状态均包括至少一个显状态以及所述隐状态到所包括的各所述显状态之间的发射概率矩阵,一个所述显状态对应一个所述标签;
[0007]根据所述隐状态、所述显状态、所述转移概率矩阵和所述发射概率矩阵,基于图算法,生成相应的对话流程图。
[0008]结合第一方面,在某些可选的实施方式中,所述将对话文本拆分成多段文本,并建立各段所述文本确定对应的标签,从而得到标签序列,包括:
[0009]将所述对话文本按照客服所说的话和客户所说的话,依次拆分得到所述客服对应的多段文本和所述客户对应的多段文本,其中,各段所述文本按照在所述对话文本中的顺序依次排列;
[0010]根据所述客服对应的多段文本建立对应的客服说话标签,根据所述客户对应的多段文本建立相应的客户说话标签,从而得到所述标签序列,其中,一段文本对应至少一个所述标签。
[0011]结合第一方面,在某些可选的实施方式中,在所述根据各所述隐状态的所述转移概率和所述发射概率,基于图算法,生成相应的对话流程图之前,所述方法还包括:
[0012]基于AIC信息准则最小化原则,从所述模型参数中选择最优的隐状态组合。
[0013]结合上一个实施方式,在某些可选的实施方式中,所述根据所述隐状态、所述显状态、所述转移概率矩阵和所述发射概率矩阵,基于图算法,生成相应的对话流程图,包括:
[0014]根据选择的所述隐状态组合、对应的所述显状态、对应的所述转移概率和所述发射概率矩阵,基于图算法,生成相应的对话流程图。
[0015]结合上一个实施方式,在某些可选的实施方式中,所述根据选择的所述隐状态组合、对应的所述显状态、对应的所述转移概率和所述发射概率矩阵,基于图算法,生成相应的对话流程图,包括:
[0016]从各所述隐状态中确定得到第一隐状态,其中,所述第一隐状态中包括第一个文本节点对应的显状态,第一个文本节点是排列所述标签序列中的第一个文本节点;
[0017]将所述第一隐状态确定为对话流程图的开始节点;
[0018]根据所述第一隐状态对应的所述转移概率矩阵,确定第一隐状态组合,其中,所述第一隐状态转移至所述第一隐状态组合中的任一隐状态的转移概率均大于预设概率阈值;
[0019]针对所述第一隐状态组合的任一隐状态,根据所述隐状态对应的所述转移概率矩阵,确定第二隐状态组合,其中,所述隐状态转移至所述第二隐状态组合中的任一隐状态的转移概率均大于所述预设概率阈值;
[0020]针对所述第二隐状态组合的任一隐状态,根据所述隐状态对应的所述转移概率矩阵,确定第三隐状态组合,如此反复循环,针对任一隐状态,直到所述隐状态转译至其他隐状态的转移概率均不大于所述预设概率阈值为止,其中,所述隐状态转移至所述第三隐状态组合中的任一隐状态的转移概率均大于所述预设概率阈值;
[0021]根据确定的各所述隐状态,基于所述图算法,生成所述对话流程图。
[0022]结合上一个实施方式,在某些可选的实施方式中,所述根据确定的各所述隐状态,基于所述图算法,生成所述对话流程图,包括:
[0023]针对确定的任一所述隐状态,生成对应的图节点,其中,所述图节点中记录对应的所述隐状态的显状态和发射概率矩阵;
[0024]针对确定的任一所述图节点,在所述图节点与关联图节点设置有向边并设置对应的权重,如此反复执行,直到覆盖确定的各所述隐状态为止,从而生成所述对话流程,其中,所述图节点对应的隐状态转移至所述关联图节点对应的隐状态的转移概率大于所述预设概率阈值,所述权重为所述图节点对应的隐状态转移至所述关联图节点对应的隐状态的转移概率,所述有向边的方向为从所述图节点指向所述关联图节点。
[0025]结合第一方面,在某些可选的实施方式中,在所述将对话文本拆分成多段文本,并建立各段所述文本确定对应的标签,从而得到标签序列之前,所述方法还包括:
[0026]将预先获得的对话文本数据进行拆分,从而获得多段文本段;
[0027]对各所述文本段进行分词,从而获得多个一元词组;
[0028]计算各所述一元词组在所述文本段中出现的频次;
[0029]根据各所述一元词组出现的频次,确定所述对话文本数据对应的热点话题组,其中,所述热点话题组包括多个所述一元词组;
[0030]针对任一所述文本段,均判断所述文本段中是否包括所述热点话题组中的至少一个所述一元词组;
[0031]若包括,则将所述文本段中包括的所述热点话题组中的所述一元词组确定为相应的所述文本段的一级话题标签。
[0032]第二方面,一种对话流程图生成装置,包括:标签序列获得单元、模型参数获得单元和流程图生成单元;
[0033]所述标签序列获得单元,用于将对话文本拆分成多段文本,并建立各段所述文本
确定对应的标签,从而得到标签序列,其中,所述标签序列包括多个文本节点,一个所述文本节点对应一段所述文本,一个所述文本节点对应至少一个所述标签;
[0034]所述模型参数获得单元,用于将所述标签序列输入至隐马尔可夫模型进行无监督学习,从而得到隐马尔科夫模型的一组模型参数,其中,所述模型参数包括多个隐状态、各所述隐状态之间的转移概率矩阵,每个所述隐状态均包括至少一个显状态以及所述隐状态到所包括的各所述显状态之间的发射概率矩阵,一个所述显状态对应一个所述标签;
[0035]所述流程图生成单元,用于根据所述隐状态、所述显状态、所述转移概率矩阵和所述发射概率矩阵,基于图算法,生成相应的对话流程图。
[0036]第三方面,一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的对话流程图生成方法。
[0037]第四方面,一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话流程图生成方法,其特征在于,包括:将对话文本拆分成多段文本,并建立各段所述文本确定对应的标签,从而得到标签序列,其中,所述标签序列包括多个文本节点,一个所述文本节点对应一段所述文本,一个所述文本节点对应至少一个所述标签;将所述标签序列输入至隐马尔可夫模型进行无监督学习,从而得到隐马尔科夫模型的一组模型参数,其中,所述模型参数包括多个隐状态、各所述隐状态之间的转移概率矩阵,每个所述隐状态均包括至少一个显状态以及所述隐状态到所包括的各所述显状态之间的发射概率矩阵,一个所述显状态对应一个所述标签;根据所述隐状态、所述显状态、所述转移概率矩阵和所述发射概率矩阵,基于图算法,生成相应的对话流程图。2.根据权利要求1所述的方法,其特征在于,所述将对话文本拆分成多段文本,并建立各段所述文本确定对应的标签,从而得到标签序列,包括:将所述对话文本按照客服所说的话和客户所说的话,依次拆分得到所述客服对应的多段文本和所述客户对应的多段文本,其中,各段所述文本按照在所述对话文本中的顺序依次排列;根据所述客服对应的多段文本建立对应的客服说话标签,根据所述客户对应的多段文本建立相应的客户说话标签,从而得到所述标签序列,其中,一段文本对应至少一个所述标签。3.根据权利要求1所述的方法,其特征在于,在所述根据各所述隐状态的所述转移概率和所述发射概率,基于图算法,生成相应的对话流程图之前,所述方法还包括:基于AIC信息准则最小化原则,从所述模型参数中选择最优的隐状态组合。4.根据权利要求3所述的方法,其特征在于,所述根据所述隐状态、所述显状态、所述转移概率矩阵和所述发射概率矩阵,基于图算法,生成相应的对话流程图,包括:根据选择的所述隐状态组合、对应的所述显状态、对应的所述转移概率和所述发射概率矩阵,基于图算法,生成相应的对话流程图。5.根据权利要求4所述的方法,其特征在于,所述根据选择的所述隐状态组合、对应的所述显状态、对应的所述转移概率和所述发射概率矩阵,基于图算法,生成相应的对话流程图,包括:从各所述隐状态中确定得到第一隐状态,其中,所述第一隐状态中包括第一个文本节点对应的显状态,第一个文本节点是排列所述标签序列中的第一个文本节点;将所述第一隐状态确定为对话流程图的开始节点;根据所述第一隐状态对应的所述转移概率矩阵,确定第一隐状态组合,其中,所述第一隐状态转移至所述第一隐状态组合中的任一隐状态的转移概率均大于预设概率阈值;针对所述第一隐状态组合的任一隐状态,根据所述隐状态对应的所述转移概率矩阵,确定第二隐状态组合,其中,所述隐状态转移至所述第二隐状态组合中的任一隐状态的转移概率均大于所述预设概率阈值;针对所述第二隐状态组合的任一隐状态,根据所述隐状态对应的所述转移概率矩阵,确定第三隐状态组合,如此反复循环,针对任一隐状态,直到所述隐状态转译至其他隐状态的转移概率均不大于所述预设概率阈值为止,其中,所述隐状态转移至所述第...

【专利技术属性】
技术研发人员:程大庆刘宏吉李新华尉建强
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1