一种应用于智慧城市场景的智能问答系统技术方案

技术编号：40126102 阅读：8 留言：0更新日期：2024-01-23 21:24

本发明专利技术涉及一种应用于智慧城市场景的智能问答系统，包括：构建模块，用于构建能够整合到智慧城市应用中的智能问答部分；搭建模块，用于搭建本地大型语言数据模型；接收提取模块，用于从所述智能问答部分接收用户问句，并从问句中提取出实体；转换模块，用于从知识图谱中取出问句中出现的实体的所有相关知识，并按照模板将带有结构特征的知识转换为自然语言；回答生成模块，用于将转换后的自然语言、用户问句以及相关任务的组合作为提示词输入至所述大型语言数据模型，得到最终回答。本发明专利技术不依赖预先设计的用户意图，鲁棒性更强。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，特别是涉及一种应用于智慧城市场景的智能问答系统。

技术介绍

1、基于知识图谱的智能问答系统相关应用有很多，例如“王松磊.基于机器人知识图谱的智能问答系统的设计与实现[d].哈尔滨师范大学,2020.”就介绍了相关技术。此类智能问答系统，通过搭建知识图谱存储结构化数据，通过实体提取、意图识别、依存句法分析、槽填充等技术手段到知识图谱中抽取相关知识，在通过模板生成将知识填入模板生成回答。

2、实体提取要求识别用户问句中在该垂直领域知识图谱中有相应实体的词语，针对自然语言处理任务中一般的实体识别任务，可以使用经典的bilstm-crf模型或bert这样的预训练transformer-encoder模型，也可以联合使用，仅通过bert将问句中的字转化为字向量再由bilstm-crf模型计算得到标签序列，再由此标签序列，根据知识图谱中实体的标签，与知识图谱中实体适配。此外，针对实体数量较少的知识图谱，也可将知识图谱中出现的待匹配实体制成字典，使用传统字符串匹配方法，如ac自动机等，进行实体匹配，直接从问句中得到知识图谱中实体。

3、意图识别，即进一步识别用户问句的意图，以精确生成图数据库查询语句。意图识别的本质是文本分类，但由于智能问答系统中意图划分更多样，不乏相似的意图，且用户的问题容易出现口语化和歧义表达，因此难度更高。文本分类可以使用tf-idf的朴素贝叶斯分类、svm(支持向量机)、lr(逻辑回归模型)等传统方法。也可以使用textcnn、textrnn等深度学习方法，bert等预训

4、对于出现多个实体并涉及其关系的问句，依存句法分析能够实现更精确的实体提取和一定的意图识别能力。槽填充通常与意图识别、实体提取和依存句法分析联合，针对每一种意图，设计若干“语义槽”。例如，如果用户提出问题：“帮我订一个外卖”，系统能够识别该问题的意图是“定外卖”，对应语义槽是“餐厅”和“菜品”，那么系统就会尝试在该问句提取出的实体中识别“餐厅”和“菜品”，如果识别到就填入语义槽，如果问句缺少信息导致有语义槽未能填充，就会进行追问，直到语义槽全部填充。此时，系统即可精确地处理用户要求，如在知识图谱中就可以精确地生成图数据库查询语句查询特定实体的特定属性。

5、这些方法的特点是，高度依赖意图识别等部分的定制化，回答过于死板，无法进行上下文连续对话，只能回答知识图谱中涉及的内容，在用户眼中过于死板。

6、chatgpt推出后，大型语言模型成为搭建智能问答系统的不二之选。大型语言模型理解能力强，不需要专门进行意图识别等操作，支持上下文连续对话，回答信息丰富，与用户的沟通更加自然。因此原本基于知识图谱的智能问答系统较为活跃的领域，如智慧医疗，开始有dr.gupta这样的基于大型语言模型的产品推出。但相比知识图谱，大型语言模型容易出现事实性错误，针对这些问题，可以将从外部知识库提取到的信息放入大型语言模型的提问prompt中，大型语言模型即可根据这些信息作出符合事实的回答。langchain(https://github.com/hwchase17/langchain)、闻达(https://github.com/wenda-llm/wenda)等项目就实现了外接知识库的大型语言模型。

7、但是，这些项目都没有实现外接知识图谱的大型语言模型。知识图谱作为高度结构化的数据，很难使用一个通用的模块，将其中的知识用自然语言表示。除非知识图谱的实体、标签、属性和关系命名均能准确反映其含义且符合某种规则，否则使用通用的模板将其转化为大型语言模型能够理解的自然语言后一定会丢失大量结构性信息，即使将这些信息送入理解能力强大的大型语言模型，也很难从中提取出特定含义的数据。

技术实现思路

1、本专利技术所要解决的技术问题是提供一种应用于智慧城市场景的智能问答系统，能够支持上下文连续对话，使得与用户的沟通更加自然。

2、本专利技术解决其技术问题所采用的技术方案是：提供一种应用于智慧城市场景的智能问答系统，包括：

3、构建模块，用于构建能够整合到智慧城市应用中的智能问答部分；

4、搭建模块，用于搭建本地大型语言数据模型；

5、接收提取模块，用于从所述智能问答部分接收用户问句，并从问句中提取出实体；

6、转换模块，用于从知识图谱中取出问句中出现的实体的所有相关知识，并按照模板将带有结构特征的知识转换为自然语言；

7、回答生成模块，用于将转换后的自然语言、用户问句以及相关任务的组合作为提示词输入至所述大型语言数据模型，得到最终回答。

8、所述构建模块包括：

9、前端制作单元，用于获取真实城市局部模型，并将所述真实城市局部模型导入unity引擎中，并形成支持查看历史的智能问答界面；

10、知识图谱构建单元，用于获取相关地理知识，设计知识图谱结构，将地理知识以csv文件组织为知识图谱；

11、问答服务构建单元，用于使用fastapi搭建智能问答服务，使用restfulapi提供服务，接收智能问答界面中用户提出的问题，并返回回答。

12、所述智能问答服务对所述问题进行实体提取，并对提取的实体进行意图识别，根据识别出的意图和实体类型、数量以及查询语句模板，生成查询语句，根据查询语句从知识图谱中取出对应的知识，并将知识根据回答模板生成回答。

13、所述意图识别基于训练好的xml-roberta模型实现。

14、所述搭建模块使用fastapi和rwkv模型，搭建本地的大型语言模型。

15、所述rwkv模型是apache2.0协议。

16、有益效果

17、由于采用了上述的技术方案，本专利技术与现有技术相比，具有以下的优点和积极效果：本专利技术在智能问答系统中引入先进的大型语言模型技术，不依赖预先设计的用户意图，鲁棒性更强；支持上下文连续对话；回答信息丰富，与用户的沟通更加自然。

本文档来自技高网...

【技术保护点】

1.一种应用于智慧城市场景的智能问答系统，其特征在于，包括：

2.根据权利要求1所述的应用于智慧城市场景的智能问答系统，其特征在于，所述构建模块包括：

3.根据权利要求2所述的应用于智慧城市场景的智能问答系统，其特征在于，所述智能问答服务对所述问题进行实体提取，并对提取的实体进行意图识别，根据识别出的意图和实体类型、数量以及查询语句模板，生成查询语句，根据查询语句从知识图谱中取出对应的知识，并将知识根据回答模板生成回答。

4.根据权利要求3所述的应用于智慧城市场景的智能问答系统，其特征在于，所述意图识别基于训练好的XML-RoBERTa模型实现。

5.根据权利要求1所述的应用于智慧城市场景的智能问答系统，其特征在于，所述搭建模块使用FastAPI和RWKV模型，搭建本地的大型语言模型。

6.根据权利要求5所述的应用于智慧城市场景的智能问答系统，其特征在于，所述RWKV模型是apache2.0协议。

【技术特征摘要】

1.一种应用于智慧城市场景的智能问答系统，其特征在于，包括：

2.根据权利要求1所述的应用于智慧城市场景的智能问答系统，其特征在于，所述构建模块包括：

3.根据权利要求2所述的应用于智慧城市场景的智能问答系统，其特征在于，所述智能问答服务对所述问题进行实体提取，并对提取的实体进行意图识别，根据识别出的意图和实体类型、数量以及查询语句模板，生成查询语句，根据查询语句从知识图谱中取出对应的知识，并将知识根据回答...

【专利技术属性】
技术研发人员：郝泳涛，董宇欣，孙泽凯，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人