改进型深度学习算法的知识图谱智能问答信息识别方法技术

技术编号：41110795 阅读：2 留言：0更新日期：2024-04-25 14:03

本发明专利技术公开了一种改进型深度学习算法的知识图谱智能问答信息识别方法，涉及自然语言处理领域，解决的是：传统知识图谱智能问答技术信息识别准确性较低、回答结果不够全面的问题，首先获取海量领域知识信息，然后对问题进行收集和预处理，然后构建所述改进型深度学习算法模型，并通过所述改进型深度学习算法模型和分类知识图谱对收集到的问题进行信息分类和问答信息识别，然后进行答案排序和过滤，并进行远程监督和性能优化；本发明专利技术公开了一种改进型深度学习算法的知识图谱智能问答信息识别方法，能够实现对输入问题的快速和准确的分类和识别，并进一步提升系统的性能和用户体验特性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自然语言处理领域，且更具体地涉及一种改进型深度学习算法的知识图谱智能问答信息识别方法。

技术介绍

1、随着知识图谱技术的发展，知识图谱智能问答已经成为了自然语言处理领域研究的热点之一，知识图谱的应用也越来越广泛，逐渐成为人工智能领域的重要技术。知识图谱是一种结构化的数据形式，其中包含了大量实体和实体之间的关系信息。知识图谱智能问答技术是基于知识图谱的人机交互方式，能够为用户提供精准、高效的问答服务。当前深度学习算法在自然语言处理领域取得了显著进展，但在知识图谱智能问答中仍然存在一些挑战，为了改善知识图谱智能问答系统的性能，研究者们开始探索如何将深度学习算法应用于该领域。

2、传统的知识图谱智能问答技术的训练数据通常来自开放的百科知识，但百科类知识的覆盖面和深度都会有所局限，不能满足复杂领域的需求。传统的机器学习算法如支持向量机、朴素贝叶斯等在信息识别方面的效果不理想，难以满足领域专业化与精度化的要求。传统的方法将关键词和分词结果用词袋模型表示，未能处理实体间关系及各种属性之间的关系，难以满足对多样化问题的回答。知识图谱作为现代人工智能时代的核心技术之一，具有信息量大、信息关联性强等特点，但传统问答技术未能很好地利用这些优势。

3、因此，本专利技术公开了一种改进型深度学习算法的知识图谱智能问答信息识别方法，利用分类知识图谱和改进型深度学习算法模型，能够实现对输入问题的快速和准确的分类和识别，同时采用优先级筛选模型和远程监督平台，进一步提升系统的性能和用户体验特性。

技术实现思路

1、针对现有技术的不足，本专利技术公开了一种改进型深度学习算法的知识图谱智能问答信息识别方法，利用分类知识图谱和改进型深度学习算法模型，能够实现对输入问题的快速和准确的分类和识别，同时采用优先级筛选模型和远程监督平台，进一步提升系统的性能和用户体验特性；通过文本挖掘和自然语言处理方法获取海量领域知识信息并构建分类知识图谱，提高了问题分类和答案提取的准确性和效率；引入多头注意力机制、上下文编码器和问题编码器等深度学习算法模型改进了问答信息识别和分类，提高了分类和答案提取的准确性和效率，并可以处理复杂的问题和语境；采用优先级筛选模型对答案进行排序和过滤，提高了答案的质量和相关度，使得用户可以更快地找到满足自己需求的答案，提高了用户体验特性；远程监督平台实现了问答信息识别过程的监督和反馈机制，可以动态地监督系统运行情况并进行模型训练，提高了系统性能和准确性；自动化、智能化程度高。

2、本专利技术采用以下技术方案：

3、一种改进型深度学习算法的知识图谱智能问答信息识别方法，包括以下步骤：

4、步骤一、构建分类知识图谱；

5、通过文本挖掘和自然语言处理方法获取海量领域知识信息，并基于所述海量领域知识信息和知识图谱构建模块构建所述分类知识图谱，所述海量领域知识信息至少包括百科全书、学术论文、新闻文献和语料库；

6、步骤二、问题收集和预处理；

7、通过关键词提取和文本分类方法对用户提出的问题进行收集，并通过信息规则引擎对收集到的问题进行异常信息去除和缺失信息填补；

8、步骤三、构建改进型深度学习算法模型；

9、通过机器学习框架构建所述改进型深度学习算法模型，所述改进型深度学习算法模型包括模型训练单元、多头注意力机制、上下文编码器、问题编码器和多标签分类网络结构，所述模型训练单元的输出端与所述问题编码器的输入端连接，所述问题编码器的输出端与所述多头注意力机制的输入端连接，所述多头注意力机制的输出端与所述上下文编码器的输入端连接，所述上下文编码器的输出端与所述多标签分类网络结构的输入端连接；

10、步骤四、问答信息识别和分类；

11、通过所述改进型深度学习算法模型和分类知识图谱对收集到的问题进行信息分类和问答信息识别；

12、步骤五、答案排序和过滤；

13、采用优先级筛选模型对获取到的答案进行排序和筛选，所述优先级筛选模型根据答案的相关度对答案进行优先级排序，并基于优先级排序对答案进行过滤；

14、步骤六、远程监督和性能优化；

15、通过远程监督平台监督问答信息的识别过程，并采用人机交互和反馈机制优化系统性能和用户体验特性，所述远程监督平台将监督信息反馈至所述改进型深度学习算法模型进行模型训练。

16、作为本专利技术进一步的技术方案，所述信息规则引擎采用模块化架构进行规则组合，所述信息规则引擎采用插值算法填补数据块内容残缺部分，并采用小波变换算法去除数据块内容冗杂、混乱和非法字符部分，所述信息规则引擎采用自然语言概率模型进行文本语法检测、分词和词性标注，并基于分词和词性标注将用户提出的问题切分成词性标签单元。

17、作为本专利技术进一步的技术方案，所述知识图谱构建模块包括数据预处理单元、领域分类单元、实体识别与链接单元、关系抽取单元、知识组织表示单元和增量更新单元，所述数据预处理单元通过自然语言处理器对知识图谱数据进行清洗和整理，所述领域分类单元通过文本领域挖掘模型lda发现所述海量领域知识信息中隐藏的领域，并根据领域分布将所述海量领域知识信息进行分类，所述实体识别与链接单元通过命名实体识别任务ner在所述海量领域知识信息中自动识别实体，并通过实体链接任务el将所述海量领域知识信息中涉及的实体链接到知识库中对应的实体，所述关系抽取单元通过关系抽取算法所述海量领域知识信息中自动提取实体之间的关系，并存储到所述分类知识图谱中，所述知识组织表示单元采用图数据库或三元组存储格式存储所述海量领域知识信息，并对所述海量领域知识信息进行索引和优化，所述增量更新单元通过时间窗口机制实时更新所述分类知识图谱，所述数据预处理单元的输出端与所述领域分类单元的输入端连接，所述领域分类单元的输出端与所述实体识别与链接单元的输入端连接，所述实体识别与链接单元的输出端与所述关系抽取单元的输入端连接，所述关系抽取单元的输出端与所述知识组织表示单元的输入端连接，所述增量更新单元的输出端与所述数据预处理单元的输入端连接。

18、作为本专利技术进一步的技术方案，所述模型训练单元采用交叉验证和随机划分结合的方法将训练样本划分为训练集、验证集和测试集，并通过迁移学习对训练集、验证集和测试集进行优化，所述多头注意力机制通过分布式并行处理框架将注意力机制扩展为多头，并采用问题关键词、实体属性和句式分析结果拆分输入向量并计算多头注意力向量，所述上下文编码器通过对上下文信息进行编码生成上下文向量表示，所述问题编码器通过对问题信息进行编码生成问题向量表示，所述多标签分类网络结构通过建立问题多个标签分类器实现对问题的多方面分类识别。

19、作为本专利技术进一步的技术方案，所述改进型深度学习算法模型和分类知识图谱对收集到的问题进行信息分类和问答信息识别包括以下步骤：

20、步骤1、数据输入；

21、将收集到的问题输入至所述改进型深度学习算法模型，并对收集到的问题进行归本文档来自技高网...

【技术保护点】

1.一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：所述信息规则引擎采用模块化架构进行规则组合，所述信息规则引擎采用插值算法填补数据块内容残缺部分，并采用小波变换算法去除数据块内容冗杂、混乱和非法字符部分，所述信息规则引擎采用自然语言概率模型进行文本语法检测、分词和词性标注，并基于分词和词性标注将用户提出的问题切分成词性标签单元。

4.根据权利要求1所述的一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：所述模型训练单元采用交叉验证和随机划分结合的方法将训练样本划分为训练集、验证集和测试集，并通过迁移学习对训练集、验证集和测试集进行优化，所述多头注意力机制通过分布式并行处理框架将注意力机制扩展为多头，并采用问题关键词、实体属性和句式分析结果拆分输入向量并计算多头注意力向量，所述上下文编码器通过对上下文信息进行编码生成上下文向量表示，所述问题编码器通过对问题信息进行编码生成问题向量表示，所述多标签分类网络结构通过建立问题多个标签分类器实现对问题的多方面分类识别。

5.根据权利要求1所述的一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：所述改进型深度学习算法模型和分类知识图谱对收集到的问题进行信息分类和问答信息识别包括以下步骤：

6.根据权利要求1所述的一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：所述优先级筛选模型包括输入层、召回层、优先级计算层、自适应权重层、排序层、过滤层和输出层，所述优先级筛选模型的工作方法包括以下步骤：

7.根据权利要求1所述的一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：所述远程监督平台通过无线通讯方式进行问答信息识别过程的监督，所述无线通讯方式采用无线抗干扰通信网络获取采集终端问答信息识别过程数据，所述无线抗干扰通信网络通过频率选择性滤波器进行降噪处理，并通过宽幅度调制、高速度调制、码分复用以及纠错编码提高载波通信的调制性能和抗干扰能力，所述无线抗干扰通信网络通过灵敏度射频放大器、低噪声指数混频器和增益天线增强信号接收能力，并采用低失真高速度模数转换器提高信号接收灵敏度。

...

【技术特征摘要】

1.一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：包括以下步骤：

3.根据权利要求1所述的一种改进型深度学习算法的知识图谱智能问答信息识别方法，其特征在于：所述知识图谱构建模块包括数据预处理单元、领域分类单元、实体识别与链接单元、关系抽取单元、知识组织表示单元和增量更新单元，所述数据预处理单元通过自然语言处理器对知识图谱数据进行清洗和整理，所述领域分类单元通过文本领域挖掘模型lda发现所述海量领域知识信息中隐藏的领域，并根据领域分布将所述海量领域知识信息进行分类，所述实体识别与链接单元通过命名实体识别任务ner在所述海量领域知识信息中自动识别实体，并通过实体链接任务el将所述海量领域知识信息中涉及的实体链接到知识库中对应的实体，所述关系抽取单元通过关系抽取算法所述海量领域知识信息中自动提取实体之间的关系，并存储到所述分类知识图谱中，所述知识组织表示单元采用图数据库或三元组存储格式存储所述海量领域知识信息，并对所述海量领域知识信息进行索引和优化，所述增量更新单元通过时间窗口机制实时更新所述分类知识图谱，所述数据预处理单元的输出端与所述领域分类单元的输入端连接，所述领域分类单元的输出端与所述实体识别与链接单元的输入端连接，所述实体识别与链接单元的输出端与所述关系抽取单元的输入端连接，所述关系抽取单元的输出端与所述知识组织表示单元的输入端连接，所...

【专利技术属性】
技术研发人员：阎星娥，冯敬玮，严荣明，张林，杨昆，刘慰慰，赵万亮，
申请(专利权)人：南京华飞数据技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人