用户问句与知识点的匹配方法和装置制造方法及图纸

技术编号:20797985 阅读:67 留言:0更新日期:2019-04-06 11:37
本说明书实施例提供一种用户问句与知识点的匹配方法和装置,方法包括:根据用户问句和预先训练的自然语言处理模型,得到第一匹配节点集合,第一匹配节点集合包括用户问句与业务导图匹配的节点;判断第一匹配节点集合是否能够匹配到业务导图的任一链路;当判断结果为否时,根据用户问句的至少一部分在互联网中搜索,获取至少一条扩展信息;根据至少一条扩展信息和自然语言处理模型,得到第二匹配节点集合,第二匹配节点集合包括扩展信息与业务导图匹配的节点;根据第一匹配节点集合和第二匹配节点集合的并集匹配业务导图的知识点,从而能够提升用户问句与知识点的匹配效果。

Matching Method and Device of User Questions and Knowledge Points

The embodiment of this specification provides a matching method and device for user questions and knowledge points. The method includes: obtaining a first set of matching nodes according to user questions and a pre-trained natural language processing model; the first set of matching nodes includes nodes matching user questions and service maps; and determining whether the first set of matching nodes can match any link of service maps. When judging whether the result is correct or not, at least one extension information is obtained by searching in the Internet according to at least part of the user's question; according to at least one extension information and natural language processing model, a second set of matching nodes is obtained, and the second set of matching nodes includes the nodes matching the extension information with the business map; and according to the first set of matching nodes and the second set of matching nodes. The knowledge points of the business map are matched by the set, which can improve the matching effect between user questions and knowledge points.

【技术实现步骤摘要】
用户问句与知识点的匹配方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及用户问句与知识点的匹配方法和装置。
技术介绍
在智能客服的问答系统中,客户在与机器人交互过程中用户问句语言口语化、简略化,提升客服机器人对用户问句与知识点匹配的能力和效果对整个问答系统十分关键,直接影响问答系统的服务体验。传统的问答系统中,通常是采用计算输入文本和目标文本之间的文本相似度的方式来完成用户问句与知识点的匹配。常用的计算文本相似度的算法包括:基于关键词匹配的算法(例如,N-gram相似度算法、Jaccard相似度算法),基于向量空间的算法(例如,Word2vec算法、TF-IDF算法),基于深度学习的算法(例如,深度学习算法、DSSM算法)等。用户问句通常为多样化、口语化的表述,例如,以下的几种情形:用户输入的词,是非常用词。如:“心脏支架的费用报销不?”中“心脏支架”就是非常用词,可能知识库中不包含该词。口语化描述,如:“蚂蚁借呗啷个还哦”。长句描述,如“我女儿3岁,没有身份证号,可以投保吗?”。输入有错别字,如“蚂蚁借贝怎么还款”。由于用户问句多样化、口语化的表述,通过上述这些计算文本相本文档来自技高网...

【技术保护点】
1.一种用户问句与知识点的匹配方法,所述方法基于业务导图进行,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的根节点代表具有特定业务类型的业务,所述业务导图的叶节点挂载与该叶节点的关键词相关联的知识点,所述方法包括:根据用户问句和预先训练的第一自然语言处理模型,得到第一匹配节点集合,所述第一匹配节点集合包括所述用户问句与所述业务导图匹配的节点;判断所述第一匹配节点集合是否能够匹配到所述业务导图的任一链路;当判断出所述第一匹配节点集合不能够匹配到所述业务导图的任一链路时,根据所述用户问句的至少一部分在互联网中搜索,获取至少一条...

【技术特征摘要】
1.一种用户问句与知识点的匹配方法,所述方法基于业务导图进行,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的根节点代表具有特定业务类型的业务,所述业务导图的叶节点挂载与该叶节点的关键词相关联的知识点,所述方法包括:根据用户问句和预先训练的第一自然语言处理模型,得到第一匹配节点集合,所述第一匹配节点集合包括所述用户问句与所述业务导图匹配的节点;判断所述第一匹配节点集合是否能够匹配到所述业务导图的任一链路;当判断出所述第一匹配节点集合不能够匹配到所述业务导图的任一链路时,根据所述用户问句的至少一部分在互联网中搜索,获取至少一条扩展信息;根据所述至少一条扩展信息和所述第一自然语言处理模型,得到第二匹配节点集合,所述第二匹配节点集合包括所述扩展信息与所述业务导图匹配的节点;判断所述第一匹配节点集合和所述第二匹配节点集合的并集是否能够匹配到所述业务导图的任一链路;当判断出所述第一匹配节点集合和所述第二匹配节点集合的并集能够匹配到所述业务导图的任一链路时,将该链路的叶节点作为与所述用户问句匹配的叶节点,以输出挂载在该叶节点的知识点。2.如权利要求1所述的方法,其中,所述根据用户问句和预先训练的第一自然语言处理模型,得到第一匹配节点集合之前,所述方法还包括:根据所述用户问句和预先训练的第二自然语言处理模型,确定所述用户语句为具有业务述求的非闲聊语句。3.如权利要求1所述的方法,其中,所述判断所述第一匹配节点集合是否能够匹配到所述业务导图的任一链路之后,所述方法还包括:当判断出所述第一匹配节点集合能够匹配到所述业务导图的任一链路时,将该链路的叶节点作为与所述用户问句匹配的叶节点,以输出挂载在该叶节点的知识点。4.如权利要求1所述的方法,其中,所述根据所述用户问句的至少一部分在互联网中搜索,获取至少一条扩展信息,包括:获取所述用户问句中的未能匹配到节点的未识别文字;根据所述用户问句和所述未识别文字在互联网中搜索,获取至少一条扩展信息。5.如权利要求1所述的方法,其中,所述根据所述用户问句的至少一部分在互联网中搜索,获取至少一条扩展信息,包括:根据所述用户问句的至少一部分,采用预设搜索方式在互联网中搜索,得到第一数目条扩展信息;从所述第一数目条扩展信息中,按照排序选取与该预设搜索方式相对应的前预设阈值数目条扩展信息,从而获取至少一条扩展信息。6.如权利要求1所述的方法,其中,所述根据所述至少一条扩展信息和所述第一自然语言处理模型,得到第二匹配节点集合,所述第二匹配节点集合包括所述扩展信息与所述业务导图匹配的节点,包括:根据所述至少一条扩展信息中的每条扩展信息和所述第一自然语言处理模型,将所述扩展信息与所述业务导图中的各个节点进行匹配;至少根据是否匹配出相应节点,得到每条扩展信息的分值;根据每条扩展信息的分值,确定所述至少一条扩展信息的综合评分;当所述综合评分符合预设条件时,将所述匹配出的相应节点加入所述第二匹配节点集合。7.如权利要求1所述的方法,其中,所述判断所述第一匹配节点集合和所述第二匹配节点集合的并集是否能够匹配到所述业务导图的任一链路之后,所述方法还包括:当判断出所述第一匹配节点集合和所述第二匹配节点集合的并集不能够匹配到所述业务导图的任一链路时,输出反问问句,以使用户根据所述反问问句进行缺失信息的补充。8.一种用户问句与知识点的匹配装置,所述装置基于业务导图进行,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表...

【专利技术属性】
技术研发人员:马良庄石志伟张望舒胡翔刘俊宏蔡捷
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1