System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及知识库,尤其涉及一种使用chatgpt构建交通筑行业标准知识库的方法和系统。
技术介绍
1、随着数字孪生的磅礴发展,逐渐形成了交通、建筑行业的各种标准,包含国家、行业、团体、企业自有的各方面的工作、建设等各种标准,实施及施工等各种标准方法。但是这些知识目前都分布零散,无法更好的汇聚到我们日常作业工作中,比如编写方案的时候,需要查询更多的方案资料后,经过各种对比,资料查询后,才能够形成一份方案。在日常建设工作中,我们要构建一份施工标准,我们需要了解施工,法规等各个方面的知识信息,才能够去编写一份施工标准。比如我们在进行模型设计的过程中,基于各行业各种项目特征的情况下,需要了解对应的组件构建尺寸标准,编码要求,必须包含要素等信息,需要翻越对应的各种场景信息后,才可以进行模型设计。日常设计人员需要花费大量的时间进行资料的查询和汇总,分析和评审以后,才能进行模型设计工作。传统的实现方案,是安排专业人员对各种知识进行分类,打标签的方式,构建一个内容加标签的数据库模型,通过和标签进行匹配的方式返回内容,这样的构建方式无法满足用户个性化的提问及额外的一些业务需求,并且这样的构建方式无法满足用户更多的复杂的业务场景需求。
技术实现思路
1、因此,为了克服现有技术的不足之处,本专利技术提供一种使用chatgpt构建交通、建筑行业标准知识库的方法和系统,降低了人工成本,并且使用方便。
2、本专利技术的一种技术方案是,提供一种使用chatgpt构建交通、建筑行业标准知识库的方法
3、获取行业标准数据;
4、将所述行业标准数据处理成文章模块;
5、chatgpt将所述文章模块处理成向量数据;
6、存储所述向量数据。
7、进一步,在将所述行业标准数据处理成文章模块的步骤中,包括如下步骤:
8、将所述行业标准数据预处理成文本数据;
9、将所述文本数据拆分成所述文章模块。
10、进一步,在将所述行业标准数据预处理成文本数据的步骤中,包括:对图片信息进行描述。
11、进一步,在将所述文本数据拆分成所述文章模块的步骤中,包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。
12、进一步,在chatgpt将所述文章模块处理成向量数据的步骤中,包括:
13、chatgpt根据模型对所述文章模块进行微调;
14、chatgpt的embedding将微调后得所述文章模块处理成所述向量数据。
15、本专利技术的另一种技术方案是,提供一种使用chatgpt构建交通、建筑行业标准知识库的系统,包括:
16、获取模块,用于获取行业标准数据;
17、处理模块,用于将所述行业标准数据处理成文章模块;
18、chatgpt,用于将所述文章模块处理成向量数据;
19、向量数据库,用于存储所述向量数据。
20、进一步,所述处理模块包括预处理模块和拆分模块;
21、预处理模块,用于将所述行业标准数据预处理成文本数据;
22、拆分模块,用于将所述文本数据拆分成所述文章模块。
23、进一步,所述预处理模块包括:对图片信息进行描述。
24、进一步,所述拆分模块包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。
25、进一步,所述chatgpt包括:
26、chatgpt根据模型对所述文章模块进行微调;
27、chatgpt的embedding将微调后得所述文章模块处理成所述向量数据。
28、本专利技术基于chatgpt构建了一个问答式的知识库系统,在构建的过程中,无需人工进行资料的梳理,并能过跟进每个文章的内容进行归纳总结,并形成相应的问题点.在用户需要了解或者给予知识库构建相应的需求时,只需要通过聊天的方式讲述需求并告知问答知识系统,即可获取到你想要的各种返回信息内,使用方便和降低了人工成本。
本文档来自技高网...【技术保护点】
1.一种使用ChatGPT构建交通、建筑行业标准知识库的方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的方法,其特征在于,在将所述行业标准数据处理成文章模块的步骤中,包括如下步骤:
3.根据权利要求2所述的方法,其特征在于,在将所述行业标准数据预处理成文本数据的步骤中,包括:对图片信息进行描述。
4.根据权利要求2所述的方法,其特征在于,在将所述文本数据拆分成所述文章模块的步骤中,包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。
5.根据权利要求1所述的方法,其特征在于,在ChatGPT将所述文章模块处理成向量数据的步骤中,包括:
6.一种使用ChatGPT构建交通、建筑行业标准知识库的系统,其特征在于,包括:
7.根据权利要求6所述的系统,其特征在于,所述处理模块包括预处理模块和拆分模块;
8.根据权利要求7所述的系统,其特征在于,所述预处理模块包括:对图片信息进行描述。
9.根据权利要求7所述的系统,其特征在于,所述拆分模块包括:对
10.根据权利要求6所述的系统,其特征在于,所述ChatGPT包括:
...【技术特征摘要】
1.一种使用chatgpt构建交通、建筑行业标准知识库的方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的方法,其特征在于,在将所述行业标准数据处理成文章模块的步骤中,包括如下步骤:
3.根据权利要求2所述的方法,其特征在于,在将所述行业标准数据预处理成文本数据的步骤中,包括:对图片信息进行描述。
4.根据权利要求2所述的方法,其特征在于,在将所述文本数据拆分成所述文章模块的步骤中,包括:对所述文本数据进行编码处理、冗余字符处理、切分完整语义片段、词法分析、分析目录树。
5.根据权利要求1所述的方法,其特征在于,在c...
【专利技术属性】
技术研发人员:余莎,
申请(专利权)人:云基智慧工程股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。