System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 使用ChatGPT构建交通筑行业标准知识库的方法和系统技术方案_技高网

使用ChatGPT构建交通筑行业标准知识库的方法和系统技术方案

技术编号:40017548 阅读:8 留言:0更新日期:2024-01-16 16:14
本发明专利技术揭露一种使用ChatGPT构建交通、建筑行业标准知识库的方法和系统,方法包括如下步骤:获取行业标准数据;将行业标准数据处理成文章模块;ChatGPT将文章模块处理成向量数据;存储向量数据。本发明专利技术基于ChatGPT构建了一个问答式的知识库系统,在构建的过程中,无需人工进行资料的梳理,并能过跟进每个文章的内容进行归纳总结,并形成相应的问题点.在用户需要了解或者给予知识库构建相应的需求时,只需要通过聊天的方式讲述需求并告知问答知识系统,即可获取到你想要的各种返回信息内,使用方便和降低了人工成本。

【技术实现步骤摘要】

本专利技术涉及知识库,尤其涉及一种使用chatgpt构建交通筑行业标准知识库的方法和系统。


技术介绍

1、随着数字孪生的磅礴发展,逐渐形成了交通、建筑行业的各种标准,包含国家、行业、团体、企业自有的各方面的工作、建设等各种标准,实施及施工等各种标准方法。但是这些知识目前都分布零散,无法更好的汇聚到我们日常作业工作中,比如编写方案的时候,需要查询更多的方案资料后,经过各种对比,资料查询后,才能够形成一份方案。在日常建设工作中,我们要构建一份施工标准,我们需要了解施工,法规等各个方面的知识信息,才能够去编写一份施工标准。比如我们在进行模型设计的过程中,基于各行业各种项目特征的情况下,需要了解对应的组件构建尺寸标准,编码要求,必须包含要素等信息,需要翻越对应的各种场景信息后,才可以进行模型设计。日常设计人员需要花费大量的时间进行资料的查询和汇总,分析和评审以后,才能进行模型设计工作。传统的实现方案,是安排专业人员对各种知识进行分类,打标签的方式,构建一个内容加标签的数据库模型,通过和标签进行匹配的方式返回内容,这样的构建方式无法满足用户个性化的提问及额外的一些业务需求,并且这样的构建方式无法满足用户更多的复杂的业务场景需求。


技术实现思路

1、因此,为了克服现有技术的不足之处,本专利技术提供一种使用chatgpt构建交通、建筑行业标准知识库的方法和系统,降低了人工成本,并且使用方便。

2、本专利技术的一种技术方案是,提供一种使用chatgpt构建交通、建筑行业标准知识库的方法,包括如下步骤:

3、获取行业标准数据;

4、将所述行业标准数据处理成文章模块;

5、chatgpt将所述文章模块处理成向量数据;

6、存储所述向量数据。

7、进一步,在将所述行业标准数据处理成文章模块的步骤中,包括如下步骤:

8、将所述行业标准数据预处理成文本数据;

9、将所述文本数据拆分成所述文章模块。

10、进一步,在将所述行业标准数据预处理成文本数据的步骤中,包括:对图片信息进行描述。

11、进一步,在将所述文本数据拆分成所述文章模块的步骤中,包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。

12、进一步,在chatgpt将所述文章模块处理成向量数据的步骤中,包括:

13、chatgpt根据模型对所述文章模块进行微调;

14、chatgpt的embedding将微调后得所述文章模块处理成所述向量数据。

15、本专利技术的另一种技术方案是,提供一种使用chatgpt构建交通、建筑行业标准知识库的系统,包括:

16、获取模块,用于获取行业标准数据;

17、处理模块,用于将所述行业标准数据处理成文章模块;

18、chatgpt,用于将所述文章模块处理成向量数据;

19、向量数据库,用于存储所述向量数据。

20、进一步,所述处理模块包括预处理模块和拆分模块;

21、预处理模块,用于将所述行业标准数据预处理成文本数据;

22、拆分模块,用于将所述文本数据拆分成所述文章模块。

23、进一步,所述预处理模块包括:对图片信息进行描述。

24、进一步,所述拆分模块包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。

25、进一步,所述chatgpt包括:

26、chatgpt根据模型对所述文章模块进行微调;

27、chatgpt的embedding将微调后得所述文章模块处理成所述向量数据。

28、本专利技术基于chatgpt构建了一个问答式的知识库系统,在构建的过程中,无需人工进行资料的梳理,并能过跟进每个文章的内容进行归纳总结,并形成相应的问题点.在用户需要了解或者给予知识库构建相应的需求时,只需要通过聊天的方式讲述需求并告知问答知识系统,即可获取到你想要的各种返回信息内,使用方便和降低了人工成本。

本文档来自技高网...

【技术保护点】

1.一种使用ChatGPT构建交通、建筑行业标准知识库的方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,在将所述行业标准数据处理成文章模块的步骤中,包括如下步骤:

3.根据权利要求2所述的方法,其特征在于,在将所述行业标准数据预处理成文本数据的步骤中,包括:对图片信息进行描述。

4.根据权利要求2所述的方法,其特征在于,在将所述文本数据拆分成所述文章模块的步骤中,包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。

5.根据权利要求1所述的方法,其特征在于,在ChatGPT将所述文章模块处理成向量数据的步骤中,包括:

6.一种使用ChatGPT构建交通、建筑行业标准知识库的系统,其特征在于,包括:

7.根据权利要求6所述的系统,其特征在于,所述处理模块包括预处理模块和拆分模块;

8.根据权利要求7所述的系统,其特征在于,所述预处理模块包括:对图片信息进行描述。

9.根据权利要求7所述的系统,其特征在于,所述拆分模块包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。

10.根据权利要求6所述的系统,其特征在于,所述ChatGPT包括:

...

【技术特征摘要】

1.一种使用chatgpt构建交通、建筑行业标准知识库的方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,在将所述行业标准数据处理成文章模块的步骤中,包括如下步骤:

3.根据权利要求2所述的方法,其特征在于,在将所述行业标准数据预处理成文本数据的步骤中,包括:对图片信息进行描述。

4.根据权利要求2所述的方法,其特征在于,在将所述文本数据拆分成所述文章模块的步骤中,包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。

5.根据权利要求1所述的方法,其特征在于,在c...

【专利技术属性】
技术研发人员:余莎
申请(专利权)人:云基智慧工程股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1