一种基于知识图谱的语音问答系统及其应用方法技术方案

技术编号：25439253 阅读：33 留言：0更新日期：2020-08-28 22:27

本发明专利技术公开了一种基于知识图谱的语音问答系统及其应用方法，终端应用模块用于声音录制以及获取数据的展示；语音识别模块负责实时监测并接收终端应用模块发送的音频信息，利用语音识别引擎进行模数转换，生成文本句式信息；语义理解模块实时接收来自语音识别模块生成的文本句式信息，利用语义理解引擎将关键词信息提取出来；数据检索模块负责接收语义理解模块生成的关键词信息，通过对知识图谱数据库的访问获取用户实际期望得到的信息，最后返回终端应用模块显示在界面上。本发明专利技术提高了输入效率，提高了检索问答句式的自由度和可靠性，并有效的节省了存储空间，提高了检索效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于知识图谱的语音问答系统及其应用方法
本专利技术涉及数据检索系统及应用方法，特别是一种基于知识图谱的、支持语音输入的高效率、高灵活性的语音问答系统及其应用方法。
技术介绍
通过多年作战指挥信息系统的建设，在数据信息中心收集、存储了各类部队、人物、车辆、工程、装备、物资等信息，已经初步地体现了数据信息汇聚的作用。但现有的作战数据汇聚和检索手段，未能满足现有系统的实际需求，数据之间的关联性、数据检索能力的准确性较弱，面向相关理论、方法和研究相对薄弱的情况下，急需开展基于现有作战数据的知识图谱语音检索研究工作。知识图谱是一种知识表示技术，可以描述客观世界的概念、实体、事件及其之间的关系。实质上，知识图谱是一种可对任何事物以及他们之间关系进行细化描述的语义关系网络。知识图谱又可以看做是一张庞大的图，图中的节点表示实体或概念，而图中的边则由属性或关系构成。目前，知识图谱在各领域中也得到了广泛的应用。同时，随着我军各领域军事数据信息的日益扩大，知识图谱的构建已是势在必行。语音识别技术是一种实现人机交互中的技术，它的功能就是让计算机完成将信息从“声音”到“文字”的转换，通过将人的语音直接转换为相应的文本或命令。从系统构成上来说，语音识别系统是建立在一定硬件平台和操作系统基础上的应用软件系统。从系统结构上来说，语音识别系统一般主要由预处理、特征提取、声学模型、识别解码、语言模型、识别结果处理等模块构成。对比传统的手动文本输入和手动命令点击，语音识别可更加有效、快速的完成文本输入和指令操作，因此语音识别技术的研究...

【技术保护点】
1.一种基于知识图谱的语音问答系统，其特征在于，包括：/n终端应用模块，用于声音录制以及获取数据的展示；/n语音识别模块，负责实时监测并接收终端应用模块发送的音频信息，利用语音识别引擎进行模数转换，生成文本句式信息；/n语义理解模块，实时接收来自语音识别模块生成的文本句式信息，利用语义理解引擎将关键词信息提取出来；/n数据检索模块，负责接收语义理解模块生成的关键词信息，通过对知识图谱数据库的访问获取用户实际期望得到的信息，最后返回终端应用模块显示在界面上。/n

【技术特征摘要】
1.一种基于知识图谱的语音问答系统，其特征在于，包括：
终端应用模块，用于声音录制以及获取数据的展示；
语音识别模块，负责实时监测并接收终端应用模块发送的音频信息，利用语音识别引擎进行模数转换，生成文本句式信息；
语义理解模块，实时接收来自语音识别模块生成的文本句式信息，利用语义理解引擎将关键词信息提取出来；
数据检索模块，负责接收语义理解模块生成的关键词信息，通过对知识图谱数据库的访问获取用户实际期望得到的信息，最后返回终端应用模块显示在界面上。

2.根据权利要求1所述的基于知识图谱的语音问答系统，其特征在于，语音识别模块包括语音识别客户端和语音识别服务端，语音识别客户端主要负责收录用户的提问语音并录制成pcm格式的音频文件发送至语音识别服务端；语音识别服务端执行语音识别的主要功能，先进行预处理和特征提取，通过抗混叠滤波将频谱上的杂音与目标区段区分开来，提取有用信息并完成模拟信号向数字信号的转换，然后送往解码器根据事先训练好的声学模型和语言模型进行模式匹配，最后将用户语音内容作为识别结果返回语音识别客户端。

3.根据权利要求1所述的基于知识图谱的语音问答系统，其特征在于，语义理解模块主要提供语义理解服务端，该语义理解服务端提供http访问接口，指挥系统通过http协议以语音识别模块得到的文本信息为参数访问语义理解服务端，语义理解服务端将文本信息与提前训练好的模板句式进行匹配，找到似然度最高的模板句式，得到该句式预先设定的关键词及其类型信息并以字符串的形式返回指挥系统。

4.根据权利要求1所述的基于知识图谱的语音问答系统，其特征在于，关键词对应知识图谱数据库中数据表的名称字段、属性名称或关系名称，类型对应数据表名、属性或关系，通过对表的查询得到用户想要检索的信息。

5.一种基于知识图谱的语音问答系统的应用方法，其特征在于，包括以下步骤：
(1)配置知识图谱数据库中表的结构信息，通过知识图谱数据库中表的字段关联构建本体模型，并利用这些模型之间的关联字段构建数据关系模型，将数据关系模型存入知识图谱数据库中；
(2)用户通过录音设备将想要检索的内容以口语的方式录入，生成音频文件发送至语音识别服务端，语音识别服务端将音频文件解析成文本信息返回给语音识别客户端；
(3)构建问答句式模型，以便语义理解模块匹配挑选出对应的关键词信息；
(4)语音识别客户端将文本信息作为参数访问语义理解服务提供的http端口，语义理解服务将该文本信息提取关键词返回给语音识别客户端；
(5)数据检索模块通过该关键词信息到知识图谱数据库中查询该关系或属性信息并通过终端应用模块展示给用户。

6.根据权利要求5所述的基于知识图谱的语音问答系统的应用方法，其特征在于，步骤(1)中数据关系模型的构建方法为：
(11)根据数据源进行本体模型构建，每张数据表都能作为一个本体；
(12)进行本体模型关系构建，两张数据表之间若存在关联字段，便进行本体模型关系构建；
(13)进行实体关系构建，将数据表中的每一条数据作为一个实体，每条数据的每个字段作为该实体的属性，两个实体间若存在关联属性的值相等或...

【专利技术属性】
技术研发人员：李泽宇，李磊，李煜祺，宋凯，陈忠，周宾，牛耕田，刘延杰，
申请(专利权)人：中国电子科技集团公司第二十八研究所，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人