一种基于知识图谱的智能问答系统技术方案

技术编号:28942063 阅读:25 留言:0更新日期:2021-06-18 21:48
本发明专利技术涉及智能问答技术领域,尤其为一种基于知识图谱的智能问答系统,包括云服务器主机、问题输入模块以及通信基站,所述云服务器主机中安装有智能问答软件,所述智能问答软件包括知识图谱获取单元、语音识别转化单元,关键词提取单元、初步搜索单元、准确搜索单元以及数据储存单元,本发明专利技术基于引入关键词提取单元、初步搜索单元以及精确搜索单元,关键词提取单元将输入的问题语句提取出相关的关键词,初步搜索单元以及精确搜索单元根据提取出的关键词对数据源进行搜索,从而提取出与问题语句匹配程度较高的数据源,从而可以对用户输入的自然语言进行识别和搜索,智能化程度较高。

【技术实现步骤摘要】
一种基于知识图谱的智能问答系统
本专利技术涉及智能问答
,具体为一种基于知识图谱的智能问答系统。
技术介绍
随着互联网上信息的爆炸式增长,人们对信息检索的需求越来越大,如何快速、精确、可靠地从大量的、模态多样化的信息中搜索到用户需要的信息,成为一个热门的迫切需要解决的课题,最初的互联网只有仅供人们浏览的静态网页,人们在互联上所能处理的事情也十分有限,随着互联网的迅猛发展,互联网已经变得越来越普及,内容也越来越丰富,模态也越来越多样,如何从这些浩瀚的互联网信息中获取用户所需的信息,成为一个难题,传统搜索引擎的出现,比如:雅虎、百度等,很大程度上解决了用户对信息搜索的需求,传统的搜索引擎技术无法从根本上解决搜索中存在的准确率低以及召回率低的问题。近几年来,知识图谱技术引起了学者们的广泛关注,将知识图谱应用到实际应用中,如智能搜索,问答系统,推荐系统等,可以将互联网的信息,更加准确、高效地传达给人类,其中构建一个垂直领域的知识图谱智能问答系统,可以将该领域内零零散散的知识充分合理地整理到一起,形成一张大的语义网,可以让人更加直观、全面、准确地了解到该领域内的知识。这类问答系统存在以下缺点:1)现有的问答系统只能够根据使用者输入的关键词进行查询,无法实现对用户输入的自然语言进行识别搜索,智能化程度较低。2)现有的问答系统只支持文字输入,一些老年人和文化程度较低的人群无法使用,实用性较低。综上所述,本专利技术通过设计一种基于知识图谱的智能问答系统来解决存在的问题。专利技术内容本专利技术的目的在于提供一种基于知识图谱的智能问答系统,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于知识图谱的智能问答系统,包括云服务器主机、问题输入模块以及通信基站,所述云服务器主机中安装有智能问答软件,所述智能问答软件包括知识图谱获取单元、语音识别转化单元,关键词提取单元、初步搜索单元、准确搜索单元以及数据储存单元,所述问题输入模块包括显示终端单元、数据传输单元、语音输入单元以及语音播放单元。优选的,所述云服务器主机、通信基站以及数据传输单元均支持无线数据连接和接收,所述数据传输单元、语音输入单元以及语音播放单元与显示终端单元均通过导线相连接,并且连接方式为电性连接。优选的,所述显示终端单元包括各种显示器,所述数据传输单元包括各种数据传输器,所述语音输入单元包括各种录音麦克风,所述语音播放单元包括各种语音播放器。优选的,所述知识图谱获取单元的具体分析步骤为:知识图谱获取单元通过互联网获取各个行业领域的数据源,从中提取每项数据的标题和正文,然后进行语句分析,从中以去除冗余的词语,保留关键信息文本,根据所述保留的关键信息文本进行语义分析,得到该数据源所属领域,将该数据储存在数据储存单元中。优选的,所述关键词提取单元分析的具体步骤为:采用字典匹配法对输入的问题语句进行分词操作,提取得到问题语句中的多个关键词,并根据关键词在问题语句中出现的频率对其进行排序,将顺序在前的关键词输入初步搜索单元中,排序在后的关键词输入准确搜索单元中。优选的,所述初步搜索单元的具体分析步骤为:初步搜索单元根据关键词提取单元输入的关键词进入数据储存单元中进行寻找,当查询的数据源中提取出的关键词出现概率高于35%,则表明该数据源与提取出的关键词初步匹配,初步搜索单元主要用于从数据储存单元中提取出与关键词相关联的数据源。优选的,所述准确搜索单元的具体分析步骤为:准确搜索单元根据关键词提取单元输入的关键词在初步搜索单元提取出的数据源中进行寻找,当提取出的关键词在数据源中出现概率高于50%,则表明该数据源与问题语句匹配,准确搜索单元用于对初步搜索单元中筛选出的数据源进行二次筛选,从而提取出与问题语句匹配度高的数据源。8.根据权利要求1所述的一种基于知识图谱的智能问答系统,具体操作步骤如下:S1,将数据传输单元、语音输入单元、语音播放单元以及显示终端单元组装成问题输入模块,问题输入模块通过无线数据网络与通信基站相连接,智能问答软件中的知识图谱获取单元通过互联网获取各个行业领域的数据源,从中提取每项数据的标题和正文,然后进行语句分析,从中以去除冗余的词语,保留关键信息文本,根据所述保留的关键信息文本进行语义分析,得到该数据源所属领域,将该数据储存在数据储存单元中,数据储存单元将输入的数据源根据所属领域进行分类储存;S2,通过语音输入单元输入问题,数据传输单元通过无线数据网络将问题语句输入通信基站中,通信基站将问题语句传输给云服务器主机内的智能问答软件;S3,智能问答软件中的语音识别转化单元会将输入的问题语句进行识别并转化成文字语言,关键词提取单元从文字语言中提取出相关的关键词,由初步搜索单元和准确搜索单元根据关键词对数据储存单元中的数据源进行搜索分析,从而提取出跟问题语句匹配程度较高的数据源;S4,云服务器主机将提取出的数据源通过通信基站输入问题输入模块中,问题输入模块将数据源显示在显示终端单元中,同时问题输入模块中的语音播放单元将数据源转化为音频数据进行播放。与现有技术相比,本专利技术的有益效果是:1、本专利技术中,通过在以前的问答系统中引入关键词提取单元、初步搜索单元以及精确搜索单元,关键词提取单元将输入的问题语句提取出相关的关键词,初步搜索单元以及精确搜索单元根据提取出的关键词对数据源进行搜索,从而提取出与问题语句匹配程度较高的数据源,从而可以对用户输入的自然语言进行识别和搜索,智能化程度较高。2、本专利技术中,通过在前的问答系统中引入语言输入单元,语言识别转化单元,用户可以通过语音输入问题,语音识别转化单元将用户输入的语音识别转化为文字语音,不需要用户通过文字输入问题,实用性较高。3、本专利技术中,通过在前的问答系统中引入语音播放单元,语音播放单元能够将搜索出的数据源转为音频数据播放出来,方便快捷。4、本专利技术中,通过在前的问答系统中引入云服务器主机,通信基站,将智能问答软件安装在云服务器主机中,云服务主机具有响应速度更快,更安全可靠以及云主机存储更方便的优点,且云服务主机使用价格较低,能够极大地降低系统的运行成本,同时通过云服务主机通过通信基站与问题输入模块连接在一起,使用通信网络进行数据传输,数据传输的速度更快,系统的反应时间缩短。附图说明图1为本专利技术整体硬件结构示意图;图2为本专利技术系统方框结构示意图。图中:1-云服务器主机、2-问题输入模块、3-通信基站、4-智能问答软件、5-知识图谱获取单元、6-语音识别转化单元、7-关键词提取单元、8-初步搜索单元、9-准确搜索单元、10-数据储存单元、11-显示终端单元、12-数据传输单元、13-语音输入单元、14-语音播放单元。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施本文档来自技高网
...

【技术保护点】
1.一种基于知识图谱的智能问答系统,包括云服务器主机(1)、问题输入模块(2)以及通信基站(3),其特征在于:所述云服务器主机(1)中安装有智能问答软件(4),所述智能问答软件(4)包括知识图谱获取单元(5)、语音识别转化单元(6),关键词提取单元(7)、初步搜索单元(8)、准确搜索单元(9)以及数据储存单元(10),所述问题输入模块(2)包括显示终端单元(11)、数据传输单元(12)、语音输入单元(13)以及语音播放单元(14)。/n

【技术特征摘要】
1.一种基于知识图谱的智能问答系统,包括云服务器主机(1)、问题输入模块(2)以及通信基站(3),其特征在于:所述云服务器主机(1)中安装有智能问答软件(4),所述智能问答软件(4)包括知识图谱获取单元(5)、语音识别转化单元(6),关键词提取单元(7)、初步搜索单元(8)、准确搜索单元(9)以及数据储存单元(10),所述问题输入模块(2)包括显示终端单元(11)、数据传输单元(12)、语音输入单元(13)以及语音播放单元(14)。


2.根据权利要求1所述的一种基于知识图谱的智能问答系统,其特征在于:所述云服务器主机(1)、通信基站(3)以及数据传输单元(12)均支持无线数据连接和接收,所述数据传输单元(12)、语音输入单元(13)以及语音播放单元(14)与显示终端单元(11)均通过导线相连接,并且连接方式为电性连接。


3.根据权利要求1所述的一种基于知识图谱的智能问答系统,其特征在于:所述显示终端单元(11)包括各种显示器,所述数据传输单元(12)包括各种数据传输器,所述语音输入单元(13)包括各种录音麦克风,所述语音播放单元(14)包括各种语音播放器。


4.根据权利要求1所述的一种基于知识图谱的智能问答系统,其特征在于:所述知识图谱获取单元(5)的具体分析步骤为:知识图谱获取单元(5)通过互联网获取各个行业领域的数据源,从中提取每项数据的标题和正文,然后进行语句分析,从中以去除冗余的词语,保留关键信息文本,根据所述保留的关键信息文本进行语义分析,得到该数据源所属领域,将该数据储存在数据储存单元(10)中。


5.根据权利要求1所述的一种基于知识图谱的智能问答系统,其特征在于:所述关键词提取单元(7)分析的具体步骤为:采用字典匹配法对输入的问题语句进行分词操作,提取得到问题语句中的多个关键词,并根据关键词在问题语句中出现的频率对其进行排序,将顺序在前的关键词输入初步搜索单元(8)中,排序在后的关键词输入准确搜索单元(9)中。


6.根据权利要求1所述的一种基于知识图谱的智能问答系统,其特征在于:所述初步搜索单元(8)的具体分析步骤为:初步搜索单元(8)根据关键词提取单元(7)输入的关键词进入数据...

【专利技术属性】
技术研发人员:韩家宽
申请(专利权)人:苏州科嘉智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1