基于人工智能的问题数据处理方法、装置、设备及介质制造方法及图纸

技术编号：40006469 阅读：29 留言：0更新日期：2024-01-09 05:13

本申请属于人工智能领域与金融科技领域，涉及基于人工智能的问题数据处理方法，包括：获取输入的问题数据的上下文数据，对问题数据与上下文数据进行关键词提取得到目标行业关键词；从知识图谱检索得到目标行业关键词的检索结果；将问题数据与检索结果转换为词嵌入，并将词嵌入映射至向量数据库内得到句子数据；基于向量数据库与交叉编码器筛选出与句子数据对应的目标文档；使用大语言模型对目标文档与句子数据进行推理，生成问题数据的问题结果。本申请还提供基于人工智能的问题数据处理装置、计算机设备及存储介质。此外，本申请的问题结果可存储于区块链中。本申请可应用于金融领域的问题处理场景，保证了生成的问题结果的精确度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能开发与金融科技领域，尤其涉及基于人工智能的问题数据处理方法、装置、计算机设备及存储介质。

技术介绍

1、近几年，大语言模型发展十分迅速，语言能力超过传统算法。大语言模型能根据对话上下文生成流畅通顺，并且具有一定逻辑性的语言文字。在金融保险领域中，许多保险公司也使用了大语言模型来进行与客户之间的对话场景的反馈处理，例如在客户查询保险保费的对话场景，客户咨询车险详情内容的对话场景，客户提出的林业险的理赔咨询的对话场景等多种业务场景中来使用大语言模型完成对于客户的问题反馈处理。然而，现有的大语言模型都是依靠神经网络中的参数学习、储存知识，往往会存在如下缺陷，首先是无法获取最新信息，导致反馈的答案中往往有许多事实谬误；其次是推理计算能力不足，难以给出准确的预测推断和建立潜在的关联，因而，当前保险公司使用大语言模型来进行与客户之间的对话场景的反馈处理会存在反馈的问题结果的精确度较低的问题，从而容易导致客户的满意度不高。

技术实现思路

1、本申请实施例的目的在于提出一种基于人工智能的问题数据处理方法、装置、计算机设备及存储介质，以解决现有的保险公司使用大语言模型来进行与客户之间的对话场景的反馈处理会存在反馈的问题结果的精确度较低的情况，从而容易导致客户的满意度不高的技术问题。

2、为了解决上述技术问题，本申请实施例提供一种基于人工智能的问题数据处理方法，采用了如下所述的技术方案：

3、接收用户在对话过程中输入的问题数据；

4、获取与所述问题

5、将所述目标行业关键词输入至与预设的大语言模型对应的知识图谱内，并获取从所述知识图谱中检索得到的与所述目标行业关键词对应的检索结果；

6、将所述问题数据与所述检索结果转换为对应的词嵌入，并将所述词嵌入映射至与所述大语言模型对应的向量数据库所在的向量空间内，以得到相应的句子数据；

7、从所述向量数据库中筛选出与所述句子数据匹配的多个候选文档；

8、基于预设的交叉编码器从所有所述候选文档中筛选出与所述句子数据对应的目标文档；

9、使用所述大语言模型对所述目标文档与所述句子数据进行推理处理，生成与所述问题数据对应的问题结果。

10、进一步的，所述获取与所述问题数据对应的上下文数据，并对所述问题数据与所述上下文数据进行关键词提取，得到对应的目标行业关键词的步骤，具体包括：

11、获取与所述问题数据对应的所述上下文数据；

12、调用预设的分词工具；其中，所述分词工具内配置有预设的行业关键词；

13、通过所述分词工具对所述问题数据与所述上下文数据进行分词处理，得到对应的分词数据；

14、通过所述分词工具中配置的所述行业关键词对所述分词数据进行关键词提取，得到所述目标行业关键词。

15、进一步的，所述从所述向量数据库中筛选出与所述句子数据匹配的多个候选文档的步骤，具体包括：

16、调用预设的目标相似度算法；

17、基于所述目标相似度算法分别计算所述句子数据与所述向量数据库中包含的各个文档之间的相似度；

18、从所有所述相似度中筛选出数值大于预设的相似度阈值的指定相似度；

19、从所有所述文档中获取与所述指定相似度对应的指定文档；

20、将所述指定文档作为所述候选文档。

21、进一步的，所述基于预设的交叉编码器从所有所述候选文档中筛选出与所述句子数据对应的目标文档的步骤，具体包括：

22、调用所述交叉编码器；

23、通过所述交叉编码器分别对所述句子数据与各所述候选文档进行拼接处理，得到对应的多个拼接数据；

24、对所有所述拼接数据进行分类处理，得到与各所述拼接数据分别对应的分类结果值；

25、从所有所述分类结果值中筛选出数值最高的指定分类结果值；

26、获取与所述指定分类结果值对应的指定拼接数据，并将与所述指定拼接数据关联的指定候选文档作为所述目标文档。

27、进一步的，在所述将所述问题数据与所述检索结果转换为对应的词嵌入，并将所述词嵌入映射至与所述大语言模型对应的向量数据库所在的向量空间内，以得到相应的句子数据的步骤之前，还包括：

28、从目标网络资源中对预设时间周期内的行业数据进行爬取；

29、对所述行业数据进行预处理，得到处理后的指定行业数据；

30、基于所述指定行业数据构建对应的向量数据库；

31、存储所述向量数据库。

32、进一步的，在所述将所述问题数据与所述检索结果转换为对应的词嵌入，并将所述词嵌入映射至与所述大语言模型对应的向量数据库所在的向量空间内，以得到相应的句子数据的步骤之前，还包括：

33、调用所述知识图谱；

34、调用所述向量数据库；

35、基于所述知识图谱与所述向量数据库构建所述大语言模型的知识库。

36、进一步的，在所述使用所述大语言模型对所述目标文档与所述句子数据进行推理处理，生成与所述问题数据对应的问题结果的步骤之后，还包括：

37、生成与所述问题结果对应的语音数据；

38、调用预设的智能机器人；

39、将所述语音数据传输给所述智能机器人，以通过所述智能机器人使用所述语音数据对所述用户进行反馈处理。

40、为了解决上述技术问题，本申请实施例还提供一种基于人工智能的问题数据处理装置，采用了如下所述的技术方案：

41、接收模块，用于接收用户在对话过程中输入的问题数据；

42、提取模块，用于获取与所述问题数据对应的上下文数据，并对所述问题数据与所述上下文数据进行关键词提取，得到对应的目标行业关键词；

43、获取模块，用于将所述目标行业关键词输入至与预设的大语言模型对应的知识图谱内，并获取从所述知识图谱中检索得到的与所述目标行业关键词对应的检索结果；

44、转换模块，用于将所述问题数据与所述检索结果转换为对应的词嵌入，并将所述词嵌入映射至与所述大语言模型对应的向量数据库所在的向量空间内，以得到相应的句子数据；

45、第一筛选模块，用于从所述向量数据库中筛选出与所述句子数据匹配的多个候选文档；

46、第二筛选模块，用于基于预设的交叉编码器从所有所述候选文档中筛选出与所述句子数据对应的目标文档；

47、第一生成模块，用于使用所述大语言模型对所述目标文档与所述句子数据进行推理处理，生成与所述问题数据对应的问题结果。

48、为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

49、接收用户在对话过程中输入的问题数据；

50、获取与所述问题数据对应的上下文数据，并本文档来自技高网...

【技术保护点】

1.一种基于人工智能的问题数据处理方法，其特征在于，包括下述步骤：

2.根据权利要求1所述的基于人工智能的问题数据处理方法，其特征在于，所述获取与所述问题数据对应的上下文数据，并对所述问题数据与所述上下文数据进行关键词提取，得到对应的目标行业关键词的步骤，具体包括：

3.根据权利要求1所述的基于人工智能的问题数据处理方法，其特征在于，所述从所述向量数据库中筛选出与所述句子数据匹配的多个候选文档的步骤，具体包括：

4.根据权利要求1所述的基于人工智能的问题数据处理方法，其特征在于，所述基于预设的交叉编码器从所有所述候选文档中筛选出与所述句子数据对应的目标文档的步骤，具体包括：

5.根据权利要求1所述的基于人工智能的问题数据处理方法，其特征在于，在所述将所述问题数据与所述检索结果转换为对应的词嵌入，并将所述词嵌入映射至与所述大语言模型对应的向量数据库所在的向量空间内，以得到相应的句子数据的步骤之前，还包括：

6.根据权利要求1所述的基于人工智能的问题数据处理方法，其特征在于，在所述将所述问题数据与所述检索结果转换为对应的词嵌

7.根据权利要求1所述的基于人工智能的问题数据处理方法，其特征在于，在所述使用所述大语言模型对所述目标文档与所述句子数据进行推理处理，生成与所述问题数据对应的问题结果的步骤之后，还包括：

8.一种基于人工智能的问题数据处理装置，其特征在于，包括：

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于人工智能的问题数据处理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于人工智能的问题数据处理方法的步骤。

...

【技术特征摘要】

1.一种基于人工智能的问题数据处理方法，其特征在于，包括下述步骤：

6.根据权利要...

【专利技术属性】
技术研发人员：刘纹石，陈当阳，
申请(专利权)人：中国平安财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人