System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于AI大模型的语义分析方法、装置及介质制造方法及图纸_技高网

一种基于AI大模型的语义分析方法、装置及介质制造方法及图纸

技术编号:41706949 阅读:20 留言:0更新日期:2024-06-19 12:37
本发明专利技术涉及语义分析技术领域,揭露了一种基于AI大模型的语义分析方法、装置及介质,包括:计算语义场景的场景关键词的场景距离,根据场景距离构建场景三角区域;根据场景三角区域对应的场景类别构建多层次特征提取层,将多层次特征提取层进行特征融合,通过多层次特征提取层及多层次信息融合层生成多层次语义融合模型;提取目标语句的目标关键词,选取目标关键词对应的目标场景三角区域,提取目标场景三角区域对应的目标场景关键词;将目标关键词及目标场景关键词生成融合向量,利用多层次语义融合模型对融合向量进行语义分析;计算语义内容与目标语句的匹配程度,根据匹配程度对语义内容进行优化。本发明专利技术可以提高语义分析时的精准度。

【技术实现步骤摘要】

本专利技术涉及语义分析,尤其涉及一种基于ai大模型的语义分析方法、装置及介质。


技术介绍

1、在当今信息爆炸的时代,文本数据已经成为人们交流、传播信息的主要方式,然而,简单地依靠关键词匹配或表面特征分析已经无法满足对文本理解的要求,为了更好地洞察文本地深层含义,语义分析技术应运而生。

2、现有的语义分析技术是通过大规模语料库中的自我监督学习来学习语言表示,从而在各种自然语言处理任务中进行语义分析。实际应用中,大规模语料库可能存在各种数据偏差,导致难以准确地捕捉到语言中地复杂语义,从而对进行语义分析时的精准度较低。


技术实现思路

1、本专利技术提供一种基于ai大模型的语义分析方法、装置及介质,其主要目的在于解决进行语义分析时的精准度较低的问题。

2、为实现上述目的,本专利技术提供的一种基于ai大模型的语义分析方法,包括:

3、提取预设的语义场景的场景关键词,利用预设的相邻场景距离算法计算所述场景关键词的场景距离,根据所述场景距离构建语义场景的场景三角区域;

4、根据所述场景三角区域对应的场景类别构建多层次特征提取层,将所述多层次特征提取层进行特征融合,得到多层次信息融合层,通过所述多层次特征提取层及所述多层次信息融合层生成多层次语义融合模型;

5、提取预设的目标语句的目标关键词,选取所述目标关键词对应的目标场景三角区域,提取所述目标场景三角区域对应的目标场景关键词;

6、将所述目标关键词及所述目标场景关键词生成融合向量,利用所述多层次语义融合模型对所述融合向量进行语义分析,得到所述目标语句的语义内容;

7、利用预设的加权匹配算法计算所述语义内容与所述目标语句的匹配程度,包括:根据所述目标语句的语句长度及所述语义内容的语义长度计算匹配惩罚值:其中,为所述匹配惩罚值,为所述语句长度,为所述语义长度,为指数函数;

8、逐一计算所述语义内容中每个词语与所述目标语句中每个词语之间的匹配概率值;利用如下的加权匹配算法根据所述匹配惩罚值及所述匹配概率值计算所述目标语句的匹配程度:其中,为所述匹配程度,为所述匹配惩罚值,为指数函数,为对数函数,为所述目标语句中第个词的匹配权重,为所述目标语句中第个词的匹配概率值;

9、根据所述匹配程度对所述语义内容进行优化,得到最佳语义内容。

10、可选地,所述利用预设的相邻场景距离算法计算所述场景关键词的场景距离,包括:

11、将所述场景关键词进行向量化,得到场景关键词向量;

12、逐一计算所述场景关键词向量之间的场景相似度;

13、根据所述场景相似度选取语义场景的相邻场景关键词;

14、计算所述相邻场景关键词与所述场景关键词之间的关键词相似度,其中关键词相似度计算公式为:其中,为场景关键词与相邻场景关键词之间的关键词相似度,为场景关键词中元素的数量,为相邻场景关键词中元素的数量,为调整系数,为场景关键词与相邻场景关键词之间的重合关键词数量,为第个关键词中元素的逆序数;

15、利用如下预设的相邻场景距离算法根据所述关键词相似度计算所述场景关键词之间的场景距离:其中,为场景关键词与相邻场景关键词之间的场景距离,为场景关键词与相邻场景关键词之间的关键词相似度。

16、可选地,所述根据所述场景距离构建语义场景的场景三角区域,包括:

17、按照从大到小的顺序将所述场景相似度排列,得到场景相似度序列;

18、在所述场景相似度序列中选取所述语义场景对应的相邻语义场景;

19、将所述相邻语义场景与所述语义场景作为三角顶点;

20、将所述相邻语义场景与所述语义场景对应的场景距离作为三角距离;

21、根据所述三角顶点及所述三角距离生成语义场景的场景三角区域。

22、可选地,所述根据所述场景三角区域对应的场景类别构建多层次特征提取层,包括:

23、将预设的卷积层作为基础特征提取层,根据预设的局部注意力机制生成局部特征提取层,根据预设的全局注意力机制生成全局特征提取层;

24、将所述基础特征提取层、所述局部特征提取层及所述全局特征提取层进行并联,得到初始多维特征提取层;

25、生成每个场景三角区域对应的场景类别与所述初始多维特征提取层的场景特征对应关系;

26、根据所述场景特征对应关系将所述初始多维特征提取层进行并联,得到多层次特征提取层。

27、可选地,所述通过所述多层次特征提取层及所述多层次信息融合层生成多层次语义融合模型,包括:

28、将预设的bret预训练模型作为输入层,将预设的残差层作为输出层;

29、将所述输入层与所述多层次特征提取层进行串联;

30、将多层次特征提取层与所述多层次信息融合层进行串联,并将多层次信息融合层与所述输出层进行串联,得到多层次语义融合模型。

31、可选地,所述选取所述目标关键词对应的目标场景三角区域,包括:

32、将所述目标关键词进行向量化,得到目标关键词向量;

33、逐一将场景三角区域中三角顶点对应的关键词向量进行向量化,得到场景关键词向量;

34、逐一计算所述目标关键词向量与所述场景关键词向量之间的向量距离;

35、选取所述向量距离最小的场景关键词向量对应的场景三角区域为目标场景三角区域。

36、可选地,所述将所述目标关键词及所述目标场景关键词生成融合向量,包括:

37、利用多层次语义融合模型中的输入层提取所述目标关键词的第一向量;

38、利用多层次语义融合模型中的输入层提取所述目标场景关键词的第二向量;

39、将所述第一向量与所述第二向量进行逐位加权融合,得到融合向量,其中融合向量为:其中,为第个维度的融合向量,为所述第一向量中第个维度的向量特征值,为所述第一向量中第个维度的向量特征权重,为所述第二向量中第个维度的向量特征权重,为所述第二向量中第个维度的向量特征值,为所述第一向量对应的偏差向量,为所述第二向量对应的偏差向量。

40、可选地,所述利用所述多层次语义融合模型对所述融合向量进行语义分析,得到所述目标语句的语义内容,包括:

41、提取所述融合向量对应的目标场景类别;

42、根据所述目标场景类别将所述融合向量输入至所述多层次语义融合模型的多层次特征提取层中,得到多层次特征;

43、利用所述多层次语义融合模型的多层次信息融合层将所述多层次特征进行融合,得到多层次融合特征;

44、利用所述多层次语义融合模型的输出层输入所述多层次融合特征对应的语义内容。

45、为了解决上述问题,本专利技术还提供一种基于ai大模型的语义分析装置,所述装置包括:

46、场景三角区域构建模块,用于提取预设的语义场景的场景关键词,利用预设的相邻场景距离算法计算所述场景本文档来自技高网...

【技术保护点】

1.一种基于AI大模型的语义分析方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于AI大模型的语义分析方法,其特征在于,所述利用预设的相邻场景距离算法计算所述场景关键词的场景距离,包括:

3.如权利要求2所述的基于AI大模型的语义分析方法,其特征在于,所述根据所述场景距离构建语义场景的场景三角区域,包括:

4.如权利要求1所述的基于AI大模型的语义分析方法,其特征在于,所述根据所述场景三角区域对应的场景类别构建多层次特征提取层,包括:

5.如权利要求1所述的基于AI大模型的语义分析方法,其特征在于,所述通过所述多层次特征提取层及所述多层次信息融合层生成多层次语义融合模型,包括:

6.如权利要求1所述的基于AI大模型的语义分析方法,其特征在于,所述选取所述目标关键词对应的目标场景三角区域,包括:

7.如权利要求1所述的基于AI大模型的语义分析方法,其特征在于,所述将所述目标关键词及所述目标场景关键词生成融合向量,包括:

8.如权利要求1所述的基于AI大模型的语义分析方法,其特征在于,所述利用所述多层次语义融合模型对所述融合向量进行语义分析,得到所述目标语句的语义内容,包括:

9.一种基于AI大模型的语义分析装置,其特征在于,所述装置包括:

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任意一项所述的基于AI大模型的语义分析方法。

...

【技术特征摘要】

1.一种基于ai大模型的语义分析方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于ai大模型的语义分析方法,其特征在于,所述利用预设的相邻场景距离算法计算所述场景关键词的场景距离,包括:

3.如权利要求2所述的基于ai大模型的语义分析方法,其特征在于,所述根据所述场景距离构建语义场景的场景三角区域,包括:

4.如权利要求1所述的基于ai大模型的语义分析方法,其特征在于,所述根据所述场景三角区域对应的场景类别构建多层次特征提取层,包括:

5.如权利要求1所述的基于ai大模型的语义分析方法,其特征在于,所述通过所述多层次特征提取层及所述多层次信息融合层生成多层次语义融合模型,包括:

6.如权...

【专利技术属性】
技术研发人员:吴天俊
申请(专利权)人:深圳觉明人工智能有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1