一种垂直领域与开放领域混合型智能问答系统的实现方法技术方案

技术编号:17248790 阅读:31 留言:0更新日期:2018-02-11 07:02
本发明专利技术公开一种垂直领域与开放领域混合型智能问答系统的实现方法,涉及人工智能领域;本发明专利技术公开了一种垂直领域与开放领域混合型智能问答系统的实现方法,将语料按照领域存放于不同的语料库中,对语料库进行处理,并使用word2vec模型进行文本向量化,对问题的领域进行垂直领域分类,明确问题的领域,从而针对该封闭领域对问答语料使用距离算法进行训练并且若该问题没有具体的领域特征,则问答系统转为开放领域,使用seq2seq深度学习模型对大量语料库进行训练使问答系统自动产生响应。因此利用本发明专利技术方法可以实现垂直领域与开放领域智能问答系统的自动切换,提高了问答系统的响应时间和响应准确度。

【技术实现步骤摘要】
一种垂直领域与开放领域混合型智能问答系统的实现方法
本专利技术公开一种智能问答系统的实现方法,涉及人工智能领域,具体地说是一种垂直领域与开放领域混合型智能问答系统的实现方法。
技术介绍
智能问答是自然语言处理领域的一个重要方向,旨在让用户直接用自然语言提问并获得答案。例如,用户询问“百度大厦在哪儿”,问答系统回答“北京市海淀区上地十街10号”。从用户的角度看,智能问答是一种简单且简洁的信息获取方法。用户直接用自然语言与问答系统交互,而无需考虑使用什么样的关键词组合表示自己的意图,所以简单;问答系统直接返回问题的答案,用户无需从冗长的相关文档中自己寻找答案内容,所以简洁。本专利技术公开了一种垂直领域与开放领域混合型智能问答系统的实现方法,将语料按照领域存放于不同的语料库中,对语料库进行处理,并使用word2vec模型进行文本向量化,对问题的领域进行垂直领域分类,明确问题的领域,从而针对该封闭领域对问答语料使用距离算法进行训练并且若该问题没有具体的领域特征,则问答系统转为开放领域,使用seq2seq深度学习模型对大量语料库进行训练使问答系统自动产生响应。因此利用本专利技术方法可以实现垂直领域与开放领域智能问答系统的自动切换,提高了问答系统的响应时间和响应准确度。
技术实现思路
本专利技术针对现有技术的问题,提供一种垂直领域与开放领域混合型智能问答系统的实现方法,具有广阔的应用前景。一种垂直领域与开放领域混合型智能问答系统的实现方法:将语料按照领域存放于不同的语料库中,对语料库进行处理,再使用word2vec模型进行文本向量化,对语料库进行领域分类并建立模型;对问答系统接收的问题利用语料库建立的模型进行领域分类,明确问题的领域,针对问题所属垂直领域内的语料库使用距离算法进行训练建立模型,使问答系统自动产生响应答句;若该问题没有具体的垂直领域特征,则问答系统将问题转为开放领域,使用seq2seq模型对问答系统的语料库进行训练建立模型,使问答系统自动产生响应答句。所述的方法使用朴素贝叶斯算法对分类的语料库进行训练构建模型,并使用所述的模型对问答系统接收的问题进行领域分类,判断所述问题属于哪个领域。所述的方法中,问答系统接收的问题所属垂直领域,则将该垂直领域内所述问题的常用问句与答句添加入该垂直领域内的语料库中,并且一个答句尽量匹配多种问句。所述的方法中,问答系统接收的问题所属垂直领域,使用Levenshtein距离算法对该垂直领域的语料库中的常用问句与答句进行训练建立模型,使问答系统自动产生响应答句。一种垂直领域与开放领域混合型智能问答系统,所述问答系统将语料按照领域存放于不同的语料库中,对语料库进行处理,再使用word2vec模型进行文本向量化,对语料库进行领域分类并建立模型;对问答系统接收的问题利用语料库建立的模型进行领域分类,明确问题的领域,针对问题所属垂直领域内的语料库使用距离算法进行训练并建立模型,使问答系统自动产生响应答句;若该问题没有具体的垂直领域特征,则问答系统将问题转为开放领域,使用seq2seq模型对问答系统的语料库进行训练建立模型,使问答系统自动产生响应答句。所述的问答系统使用朴素贝叶斯算法对分类的语料库进行训练构建模型,并使用所述的模型对问答系统接收的问题进行领域分类,判断所述问题属于哪个领域。所述的问答系统接收的问题所属垂直领域,则将该垂直领域内所述问题的常用问句与答句添加入该垂直领域内的语料库中,并且一个答句尽量匹配多种问句。所述问答系统接收的问题所属垂直领域,使用Levenshtein距离算法对该垂直领域的语料库中的常用问句与答句进行训练建立模型,使问答系统自动产生响应答句。本专利技术的有益之处是:本专利技术公开了一种垂直领域与开放领域混合型智能问答系统的实现方法,将语料按照领域存放于不同的语料库中,对语料库进行处理,并使用word2vec模型进行文本向量化,对问题的领域进行垂直领域分类,明确问题的领域,从而针对该封闭领域对问答语料使用距离算法进行训练并且若该问题没有具体的领域特征,则问答系统转为开放领域,使用seq2seq深度学习模型对大量语料库进行训练使问答系统自动产生响应。因此利用本专利技术方法可以实现垂直领域与开放领域智能问答系统的自动切换,提高了问答系统的响应时间和响应准确度。附图说明图1是本专利技术方法流程示意图。具体实施方式本专利技术提供一种垂直领域与开放领域混合型智能问答系统的实现方法:将语料按照领域存放于不同的语料库中,对语料库进行处理,再使用word2vec模型进行文本向量化,对语料库进行领域分类并建立模型;对问答系统接收的问题利用语料库建立的模型进行领域分类,明确问题的领域,针对问题所属垂直领域内的语料库使用距离算法进行训练建立模型,使问答系统自动产生响应答句;若该问题没有具体的垂直领域特征,则问答系统将问题转为开放领域,使用seq2seq模型对问答系统的语料库进行训练建立模型,使问答系统自动产生响应答句。同时提供与上述方法相对应的一种垂直领域与开放领域混合型智能问答系统。利用本专利技术方法,主要进行以下步骤,得到垂直领域与开放领域混合型智能问答系统。其中对语料进行处理:将语料按照领域存放于不同的语料库中,如体育相关的语料,存放于体育语料库中,影视相关的语料存放于影视语料库中等等,再对语料库进行分词,去除停用词等,使用word2vec模型进行文本向量化,对语料库进行领域分类并使用朴素贝叶斯算法对分类的语料库建立模型;问题检索分类:对于问答系统接收的用户的问题,使用朴素贝叶斯构建的语料库模型对问题进行分类,判断其属于哪个领域的问题;垂直领域语料检索:若问答系统接收的问题所属为垂直领域,则将该垂直领域内所述问题的常用问句与答句添加入该垂直领域内的语料库中,并且一个答句尽量匹配多种问句,对于用户的问题,使用Levenshtein距离算法对该垂直领域的语料库中的常用问句与答句进行训练建立模型,使问答系统自动产生响应答句;而开放领域:若问答系统接收的问题没有具体的垂直领域特征,则问答系统将问题转为开放领域,对于开放领域的问题,使用深度学习的seq2seq模型对开放领域的问答语料进行训练建模,并自动产生回答。因此本专利技术可以既应用在垂直封闭领域,比如银行的自助客服,商场的自助购物,企业的自助电话等又可以应用在开放领域进行开放领域的闲聊式问答,并且保证快速准确响应的条件下,提高了问答系统的响应时间和响应准确度。本文档来自技高网...
一种垂直领域与开放领域混合型智能问答系统的实现方法

【技术保护点】
一种垂直领域与开放领域混合型智能问答系统的实现方法,其特征是将语料按照领域存放于不同的语料库中,对语料库进行处理,再使用word2vec模型进行文本向量化,对语料库进行领域分类并建立模型;对问答系统接收的问题利用语料库建立的模型进行领域分类,明确问题的领域,针对问题所属垂直领域内的语料库使用距离算法进行训练建立模型,使问答系统自动产生响应答句;若该问题没有具体的垂直领域特征,则问答系统将问题转为开放领域,使用seq2seq模型对问答系统的语料库进行训练建立模型,使问答系统自动产生响应答句。

【技术特征摘要】
1.一种垂直领域与开放领域混合型智能问答系统的实现方法,其特征是将语料按照领域存放于不同的语料库中,对语料库进行处理,再使用word2vec模型进行文本向量化,对语料库进行领域分类并建立模型;对问答系统接收的问题利用语料库建立的模型进行领域分类,明确问题的领域,针对问题所属垂直领域内的语料库使用距离算法进行训练建立模型,使问答系统自动产生响应答句;若该问题没有具体的垂直领域特征,则问答系统将问题转为开放领域,使用seq2seq模型对问答系统的语料库进行训练建立模型,使问答系统自动产生响应答句。2.根据权利要求1所述的方法,其特征是使用朴素贝叶斯算法对分类的语料库进行训练构建模型,并使用所述的模型对问答系统接收的问题进行领域分类,判断所述问题属于哪个领域。3.根据权利要求1或2所述的方法,其特征是所述问题所属垂直领域,则将该垂直领域内所述问题的常用问句与答句添加入该垂直领域内的语料库中,并且一个答句尽量匹配多种问句。4.根据权利要求3所述的方法,其特征是所述问题所属垂直领域,使用Levenshtein距离算法对该垂直领域的语料库中的常用问句与答句进行训练建立模型,使问答系统自动产生响应答句。5.一种垂直领域与开放领域混...

【专利技术属性】
技术研发人员:尹青山段成德于治楼
申请(专利权)人:济南浪潮高新科技投资发展有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1