自动提取问答语料的方法、在线智能客服系统及电子设备技术方案

技术编号:20655095 阅读:33 留言:0更新日期:2019-03-23 06:47
本发明专利技术涉及自然语言处理技术,提供了一种自动提取问答语料的方法,所述方法包含步骤:从所述原始语料中确定出至少一组对话语料;基于预设规则识别各个所述对话语料中的疑问句;基于所述疑问句在所在所述对话语料中的位置信息,将所述对话语料分割成若干个问答片段;基于各个所述问答片段,提取所述问答语料。基于本发明专利技术所提供的自动提取问答语料的方法,可大幅度减少需要人工处理的工作量,节省了人工成本,且提升了处理速率。此外,本发明专利技术还提供了一种在线智能客服系统及电子设备。

【技术实现步骤摘要】
自动提取问答语料的方法、在线智能客服系统及电子设备
本专利技术涉及自然语言处理
,尤其涉及一种自动提取问答语料的方法、在线智能客服系统及电子设备。
技术介绍
随着互联网的飞速发展,人们服务意识的提高,网络客服已经普及到各行各业,深入到日常商业服务的各个环节。目前的网络客服系统,通常由机器客服和人工客服组成,其中机器客服一般是基于网页的即时通讯工具,具体可基于FAQ系统来实现。具体而言,在构建某个专门领域的机器客服系统时,需要依赖大量的语料数据,即机器客服的知识库,其中,知识库一般是以FAQ的形态保存在系统数据库中的,主要包含提问信息及对应的回复信息等字段,机器客服在接收到用户提出的问题时,可基于FAQ系统查找对应的回复信息,并反馈给用户,故构建完整的FAQ数据库为机器客服技术实现的关键之一。在构建FAQ数据库的过程中,通常会收集某个领域的聊天记录作为原始语料,首再通过从原始语料中提取出问题信息及对应的回复信息进,得到一系列FAQ数据。然而,目前FAQ数据的提取多数是依赖人工提取的方式来完成,由于原始语料数据量庞大,完全依赖人工来进行提取,工作量大,人工成本高,并存在一定的低效性本文档来自技高网...

【技术保护点】
1.一种自动提取问答语料的方法,其特征在于,所述方法包含步骤:从所述原始语料中确定出至少一组对话语料;基于预设规则识别各个所述对话语料中的疑问句;基于所述疑问句在所在所述对话语料中的位置信息,将所述对话语料分割成若干个问答片段;基于各个所述问答片段,提取所述问答语料。

【技术特征摘要】
1.一种自动提取问答语料的方法,其特征在于,所述方法包含步骤:从所述原始语料中确定出至少一组对话语料;基于预设规则识别各个所述对话语料中的疑问句;基于所述疑问句在所在所述对话语料中的位置信息,将所述对话语料分割成若干个问答片段;基于各个所述问答片段,提取所述问答语料。2.如权利要求1所述的方法,其特征在于,所述基于预设规则识别各个所述对话语料中的疑问句具体包括:基于预设字符及正则表达式的匹配,识别各个所述对话语料中的疑问句。3.如权利要求1所述的方法,其特征在于,所述基于所述疑问句在所在所述对话语料中的位置信息,将所述对话语料分割成若干给问答片段具体包含:确定各个所述疑问句在所在的所述对话语料中出现的先后顺序,作为所述位置信息;基于所述位置信息,将前一个所述疑问句与相邻的后一个所述疑问句之间出现的非疑问句,与所述前一个疑问句归为同一个所述问答片段,其中所述问答片段中的所述疑问句与所述非疑问句的先后关系与所述对话语料中的相同。4.如权利要求1所述的方法,其特征在于,所述基于各个所述问答片段,提取所述问答语料具体包含:设定所述问答片段中的所述疑...

【专利技术属性】
技术研发人员:林志伟肖龙源蔡振华李稀敏刘晓葳谭玉坤
申请(专利权)人:厦门快商通信息技术有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1