一种基于人工智能的自然语言处理方法及系统技术方案

技术编号：41324229 阅读：4 留言：0更新日期：2024-05-13 15:02

本发明专利技术公开了一种基于人工智能的自然语言处理方法及系统，包括：收集自然语言数据，对自然语言数据进行清洗和标注，建立数据分析模型分析自然语言数据；构建交叉语言学习模型，利用深度学习进行语义理解并生成回应；收集用户反馈，通过网络对数据库进行更新完善。本发明专利技术方法从多样化数据源中提取信息，通过数据分析模型计算与历史数据的相似度，使模型能够精准地区分普通话和各种方言，提高了语义理解的深度和广度。进一步根据区分普通话和各种方言建立交叉语言学习模型，针对性的进行特征提取，进行语义理解并生成回应。此外，通过收集用户反馈并实时更新数据库，实现了模型的自我学习和优化，确保了长期的有效性和适应性，显著提升了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及工智能语言，具体为一种基于人工智能的自然语言处理方法及系统。

技术介绍

1、自然语言处理是一种人工智能技术，用于处理、解析、理解和生成人类语言，用于和人类共同，给人们的生活进行各种人工智能的服务，从而使人们的生活水平提高，但是现有的人工智能不能对人们的语气进行分析，从而导致对话障碍，并且缺乏自主学习功能，导致人工智能智能根据自身储存的信息进行智能服务，需要人工定期进行跟新系统，耗费人力，所以需要设计一种基于人工智能的自然语言处理系统及方法。

技术实现思路

1、鉴于上述存在的问题，提出了本专利技术。

2、因此，本专利技术解决的技术问题是：现有的人工智能不能对人们的语气进行分析，存在对话障碍，并且缺乏自主学习功能。

3、为解决上述技术问题，本专利技术提供如下技术方案：一种基于人工智能的自然语言处理方法，包括：收集自然语言数据，对自然语言数据进行清洗和标注，建立数据分析模型分析自然语言数据；构建交叉语言学习模型，利用深度学习进行语义理解并生成回应；收集用户反馈，通过网络对数据库进行更新完善。

4、作为本专利技术所述的基于人工智能的自然语言处理方法的一种优选方案，其中：所述自然语言数据包括文本数据集、语音数据集、多语言数据集、标准化语料库以及情感分析数据，数据集包含来自不同地区、文化背景的语言样本。

5、作为本专利技术所述的基于人工智能的自然语言处理方法的一种优选方案，其中：所述数据分析模型包括，考虑到自然语言数据的多样性，通过

6、

7、其中，s表示相似度评分；n表示数据点总数；t(i)表示第i个数据点的音调特征；f(t,θ)表示模拟音调特征随时间的变化的函数；o(i)表示第i个数据点的语言特征；v表示权重矩阵；φ表示控制参数；g(o(i)，φ)表示描述语言特征的非线性关系的函数。

8、作为本专利技术所述的基于人工智能的自然语言处理方法的一种优选方案，其中：所述数据分析模型还包括，通过f(t,θ)模拟音调随时间的变化，捕获语言的音调模式，表示为：

9、

10、通过g(o(i)，φ)捕捉语言特征的非线性关系，表示为：

11、

12、其中，θ1表示振幅控制参数；θ2表示频率控制参数；t表示时间变量；θ3表示相位控制参数；θ4表示衰减项控制参数；θ5表示衰减项指数参数；φ1表示函数幅度控制参数；φ2表示函数对数位移的调整参数；φ3表示函数幅度控制参数；φ4表示函数的水平位移的调整参数。

13、作为本专利技术所述的基于人工智能的自然语言处理方法的一种优选方案，其中：分析所述自然语言数据包括，根据历史数据集的统计信息动态设定相似度评分的阈值sl>sh，将收集的自然语言数据分别与普通话和方言数据进行对比，并根据数据分析模型的评分s由高到低建立评分排序，当收集的自然语言数据与普通话的相似度评分sp≥sph时，判断为当前自然语言为普通话，当收集的自然语言数据与普通话的相似度评分sp<sph时，判断为当前自然语言为方言，与方言数据进行进一步对比；当收集的自然语言数据与方言a的相似度评分sa<sal，判断为当前自然语言与方言a完全不同，不进入评分排序；当收集的自然语言数据与方言a的相似度评分sa≥sah，判断为当前自然语言与方言a高度相似，若只有方言a的相似度评分sa≥sah，则判断当前自然语言为方言a；若存在其他方言的相似度评分s≥sh，则判断当前自然语言为评分排序相似度最高的方言；当收集的自然语言数据与方言a的相似度评分sal≤sa<sah时，判断为当前自然语言与方言a部分相似，根据评分排序中的方言数据，通过竞合矩阵进一步判断，表示为：

14、cij＝ws·simij+wg·geoij+wc·culij

15、

16、其中，cij表示第i个方言与第j个方言之间的竞合程度；w表示权重矩阵；simij表示基于语言特征的相似度；geoij表示地理位置的距离；culij文化联系强度；当方言a的总竞合度最低时，判断当前自然语言为方言a。

17、作为本专利技术所述的基于人工智能的自然语言处理方法的一种优选方案，其中：所述交叉语言学习模型包括，根据数据分析模型判断出的方言种类将方言特有的表达转换为标准语言的等效表达，根据历史数据总结方言的音调、音素和节奏特点并进行提取，分析自然语言数的含义并生成回应，表示为：

18、

19、利用seq2seq模型建立回应生成函数ψ，将音调特征的积分结果作为编码器的输入，同时将语言特征的非线性关系作为附加的上下文信息提供给解码器，表示为：

20、

21、其中，r表示最终生成的回应；l表示自然语言数据的长度；n表示用于语义理解的特征数量；wi表示平衡不同特征的权重系数；δi表示非线性转换函数；ti(x，θ)表示第i个特征提取函数；x表示特征提取的数据点；θ表示特征提取的参数集；ψ表示整合所有语义单元并生成回应的函数；m表示用于回应生成的语义单元数量；wj表示平衡不同语义单元的权重系数；σj表示第j个语义单元的激活函数；sj(y，φ)表示第j个语义理解函数；y表示回应生成的数据点；φ表示回应生成的参数集；λ表示控制回应生成过程的参数集；h表示编码器处理后的隐藏状态；c表示解码器在生成每个输出时考虑的附加上下文信息。

22、作为本专利技术所述的基于人工智能的自然语言处理方法的一种优选方案，其中：所述更新完善为根据收集的用户反馈通过网络更新数据库，包括添加新的语言样本、调整现有语言样本的分类、优化语义理解单元的参数设置，以及改进交叉语言学习模型的特征提取算法。

23、第二方面，本专利技术还提供了基于人工智能的自然语言处理系统，包括，数据处理模块，收集自然语言数据并进行预处理，建立数据分析模型分析自然语言数据，计算当前自然语言与普通话、方言的相似度，判断自然语言数据的方言种类；深度学习模块，根据数据分析模型判断出的方言种类，构建交叉语言学习模型进行特征提取，结合方言的特点进行语义理解并生成回应；回应模块，收集用户反馈，根据收集的用户反馈通过网络更新数据库。

24、第三方面，本专利技术还提供了一种计算设备，包括：存储器和处理器；

25、所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现所述基于人工智能的自然语言处理方法的步骤。

26、第四方面，本专利技术还提供了一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现所述基于人工智能的自然语言处理方法的步骤。

27、本专利技术的有益效果：本专利技术方法从多样化数据源中提取信息，通过数据分析模型计算与历史数据的相似度，使模型能够精准地区分普通话和各种方言，提高了语义理解的深度和广度。进一步根据区分普通话和各种方言本文档来自技高网...

【技术保护点】

1.一种基于人工智能的自然语言处理方法，其特征在于，包括：

2.如权利要求1所述的基于人工智能的自然语言处理方法，其特征在于：所述自然语言数据包括文本数据集、语音数据集、多语言数据集、标准化语料库以及情感分析数据，数据集包含来自不同地区、文化背景的语言样本。

3.如权利要求2所述的基于人工智能的自然语言处理方法，其特征在于：所述数据分析模型包括，考虑到自然语言数据的多样性，通过计算收集的自然语言数据与历史数据的相似度，判断当前自然语言数据是某地方言还是普通话，表示为：

4.如权利要求3所述的基于人工智能的自然语言处理方法，其特征在于：所述数据分析模型还包括，通过f(t,θ)模拟音调随时间的变化，捕获语言的音调模式，表示为：

5.如权利要求4所述的基于人工智能的自然语言处理方法，其特征在于：分析所述自然语言数据包括，根据历史数据集的统计信息动态设定相似度评分的阈值Sl>Sh，将收集的自然语言数据分别与普通话和方言数据进行对比，并根据数据分析模型的评分S由高到低建立评分排序，当收集的自然语言数据与普通话的相似度评分Sp≥Sph时，

6.如权利要求5所述的基于人工智能的自然语言处理方法，其特征在于：所述交叉语言学习模型包括，根据数据分析模型判断出的方言种类将方言特有的表达转换为标准语言的等效表达，根据历史数据总结方言的音调、音素和节奏特点并进行提取，分析自然语言数的含义并生成回应，表示为：

7.如权利要求6所述的基于人工智能的自然语言处理方法，其特征在于：所述更新完善为根据收集的用户反馈通过网络更新数据库，包括添加新的语言样本、调整现有语言样本的分类、优化语义理解单元的参数设置，以及改进交叉语言学习模型的特征提取算法。

8.一种采用如权利要求1～7任一所述方法的基于人工智能的自然语言处理系统，其特征在于，包括，

9.一种计算设备，包括：存储器和处理器；

10.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至7任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种基于人工智能的自然语言处理方法，其特征在于，包括：

5.如权利要求4所述的基于人工智能的自然语言处理方法，其特征在于：分析所述自然语言数据包括，根据历史数据集的统计信息动态设定相似度评分的阈值sl>sh，将收集的自然语言数据分别与普通话和方言数据进行对比，并根据数据分析模型的评分s由高到低建立评分排序，当收集的自然语言数据与普通话的相似度评分s...

【专利技术属性】
技术研发人员：汤力，陈兴培，许娟，张幸一，詹国晔，刘欣然，易辉，陈俊伟，
申请(专利权)人：云南电网有限责任公司信息中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人