System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大语言模型的收费公路路径拟合方法及系统技术方案_技高网

一种基于大语言模型的收费公路路径拟合方法及系统技术方案

技术编号:41252432 阅读:3 留言:0更新日期:2024-05-10 00:00
本发明专利技术属于公路收费技术领域,公开了一种基于大语言模型的收费公路路径拟合方法及系统。该方法通过引入Langchain大语言模型框架,经过多维度的深度训练,使收费系统能根据语义信息智能模拟和分析出车辆行驶路径,利用大语言模型预测的路径信息与ETC门架图像工具、费率工具、收费统计工具实际行驶情况进行验证,找出拟合损失路径,从而实现收费的准确性和智能化。本发明专利技术有效降低了通行费的误差,同时也为收费人员带来更为智能、灵活的操作体验。本发明专利技术通过引入Langchain大语言模型框架(嵌入式机器学习模型),经过多维度的深度训练,使收费系统能根据语义信息智能模拟和分析出车辆行驶路径。

【技术实现步骤摘要】

本专利技术属于公路收费,尤其涉及一种基于大语言模型的收费公路路径拟合方法及系统


技术介绍

1、高速公路计费模式逐步实行按分段计费、出口收费,目前的计费模式主要是依赖于高速公路建设的etc门架图像系统,利用车牌抓拍和etc射频天线等技术,以实现对途经车辆基本信息的实时采集,按照车辆实际行驶的距离进行计费。

2、尽管这一计费模式带来了便捷和精确,但也面临着一些挑战,一是门架设备信息可能出现误识别或故障,另外,部分司机可能采取措施屏蔽pcp卡或车载终端信号,从而影响行驶轨迹的准确记录,进而影响计费的准确性。


技术实现思路

1、为克服相关技术中存在的问题,本专利技术公开实施例提供了一种基于大语言模型的收费公路路径拟合方法及系统。

2、所述技术方案如下:基于大语言模型的收费公路路径拟合方法,包括:

3、s1,收集高速公路网的信息,绘制出整个路网模型图,通过大语言模型在该路网模型图上执行深度优先遍历算法,计算出每条路径的总距离和相应的费率;基于所述费率构建大语言费率模型,通过调用文本嵌入式模型将大语言费率模型数据信息存储于向量数据库,以备用户后续的语义化查询和调用;所述高速公路网的信息包括:路网数据、收费站、道路长度、道路所属路段、道路的连接关系以及交叉口;

4、s2,使用自然语言进行问题查询时,通过文本嵌入式模型将用户问题信息转换为向量数据,通过大语言模型实现向量数据库查找与问题向量值最相似向量的确定,识别最匹配的问题,找到匹配项后,将文本格式的内容发送给大语言模型,大语言模型以语义化的形式拟合出一条或多条的行驶路径方案,并生成回答;

5、s3,车辆在高速公路出口通过读取通行介质进行收费,若存在路径信息获取异常,通过大语言模型调用向量数据库拟合出车辆可能的行驶轨迹,并将结果数据返回给大语言模型,由大语言模型根据返回结果,进行路径拟合验证,获取到该车辆实际行驶路径。

6、在步骤s1中,所述收集高速公路网的信息,绘制出整个路网模型图,包括:使用python编程语言构建详细的路网节点和边的数据结构,通过networkx工具绘制出整个路网模型图。

7、在步骤s1中,所述基于所述费率构建大语言费率模型,包括:运用langchain大语言模型框架,将费率信息导入pdf或word文件中并应用递归向量值数据串文本分割器技术,将pdf或word文件内容分割成多个独立的段落块,并为每一块赋予唯一的编号,完成大语言费率模型的构建。

8、在步骤s1中,所述通过调用文本嵌入式模型将大语言费率模型数据信息存储于向量数据库,包括:通过调用文本嵌入式模型openai embeddings将多个独立的段落块映射到向量空间中,并存储于向量数据库中,向量数据库采用向量数组形式存储数据;其中,所述多个独立的段落块包括大语言费率模型参数、结构和源数据信息。

9、在步骤s2中,所述通过大语言模型实现向量数据库查找与问题向量值最相似向量的确定,识别最匹配的问题,包括:

10、步骤一,收集大量的问题数据作为源数据;

11、步骤二,使用源数据初始化匹配识别器;

12、步骤三,确定向量值数据串数据的相似度匹配策略;

13、步骤四,使用聚类算法,采用段落块极大值方法选取最适合场合的聚类数目,使得每个类别群的平均数据相似度最大;

14、步骤五,得到数据集合,并检验准确度,在准确度不大于阈值时进行数据集合自修正;

15、计算各个类别中数据相似度fd小于0.9的数目,即f(fd<0.9),f为数据的数目(向量值数据串数据相似度fd小于0.9的数目);设阈值为l,对向量数据库调整优化的条件为:

16、

17、步骤六,生成规则集合,利用规则集合解析问题信息;

18、步骤七,新加入的数据占总数据达到比例时,自动检验数据集合聚类准确度,根据数据集合聚类准确度对数据进行清洗优化向量数据库。

19、在步骤二中,所述使用源数据初始化匹配识别器,包括:

20、(1)对一条问题数据,向量值数据串部分出现频率高的相同部分是高权重的,费率部分出现频率低的不同部分是高权重的,两者结合共同代表一条数据的高权重部分;对向量值数据串部分采用正向文件频率,相同部分权重高;而费率部分则采用逆向文件频率,相同部分权重低;

21、(2)将每一条数据划成一行,每一行在后续的计算中都当作一个文档,对每一个文档中的车辆行驶路径分别作距离计算处理,实现对不同问题数据的区别标记;

22、(3)分别计算问题数据中的向量值数据串部分的权重fs和费率部分的权重fn,将fs和fn按权重结合得出该条数据的总权重f,表达式为:

23、f=fs+fn。

24、在步骤三中,所述确定向量值数据串数据的相似度匹配策略,包括:

25、(ⅰ)初始化一个矩阵time[a,b],其中,a∈[0,str.length()],b∈[0,target.length()],使第一行和列的值从0开始增量递加,a变量代表被比较向量值数据串str索引,b变量代表target向量值数据串索引,该矩阵中定义临时变量c来记录两个向量值数据串的相同向量值数据串数量,相同时c=0,不同时c=1;其中,str.length()为向量值数据串长度函数,target.length()为匹配的目标相似度长度函数;

26、(ⅱ)依次遍历目标向量值数据串str,使其与target向量值数据串进行匹配标记,a与b变量在两个数据向量值数据串上遍历;依次匹配到相同的向量值数据串,就做标记;stra=sargetb,将临时变量c标记为0;对矩阵time[a][b]赋值,该值是该值是time[a-1][b]+1,time[a][b-1]+1,time[a-1][b-1]+tc三者之中的最小值;其中,stra为a变量的向量值数据串,sargetb为b变量的匹配的目标相似度,t为索引状态,包括相同或不相同状态,c为临时变量;

27、(ⅲ)每完成一次循环就标记最小增量,获得time[str.length][target.length]的增量标记d(str.target),该增量标记是标为两个串不同的部分,最终计算相似度是需要除去不相同的部分,计算向量值数据串的相似度公式如下:

28、

29、式中,fd为相似度值,fd∈[0,1],d(str.target)为增量标记,count.max()为最大时的计算函数,str.length()为向量值数据串长度函数,target.length()为匹配的目标相似度长度函数。

30、在步骤四中,所述采用段落块极大值方法选取最适合场合的聚类数目,包括:确定准确度,使用相似度进行比较,当时,即fd(ga)远远大于fd(gb),取g=ga,此时g值即为所求;fd(ga)≈fd(gb),a<b;数据集划分为相近种类本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的收费公路路径拟合方法,其特征在于,该方法包括:

2.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤S1中,所述收集高速公路网的信息,绘制出整个路网模型图,包括:使用Python编程语言构建详细的路网节点和边的数据结构,通过NetworkX工具绘制出整个路网模型图。

3.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤S1中,所述基于所述费率构建大语言费率模型,包括:运用Langchain大语言模型框架,将费率信息导入PDF或WORD文件中并应用递归向量值数据串文本分割器技术,将PDF或WORD文件内容分割成多个独立的段落块,并为每一块赋予唯一的编号,完成大语言费率模型的构建。

4.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤S1中,所述通过调用文本嵌入式模型将大语言费率模型数据信息存储于向量数据库,包括:通过调用文本嵌入式模型OpenAI Embeddings将多个独立的段落块映射到向量空间中,并存储于向量数据库中,向量数据库采用向量数组形式存储数据;其中,所述多个独立的段落块包括大语言费率模型参数、结构和源数据信息。

5.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤S2中,所述通过大语言模型实现向量数据库查找与问题向量值最相似向量的确定,识别最匹配的问题,包括:

6.根据权利要求5所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤二中,所述使用源数据初始化匹配识别器,包括:

7.根据权利要求5所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤三中,所述确定向量值数据串数据的相似度匹配策略,包括:

8.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤四中,所述采用段落块极大值方法选取最适合场合的聚类数目,包括:

9.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤S3中,所述进行路径拟合验证,包括:

10.一种基于大语言模型的收费公路路径拟合系统,其特征在于,该系统实施权利要求1-9任意一项所述基于大语言模型的收费公路路径拟合方法,该系统包括:

...

【技术特征摘要】

1.一种基于大语言模型的收费公路路径拟合方法,其特征在于,该方法包括:

2.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤s1中,所述收集高速公路网的信息,绘制出整个路网模型图,包括:使用python编程语言构建详细的路网节点和边的数据结构,通过networkx工具绘制出整个路网模型图。

3.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤s1中,所述基于所述费率构建大语言费率模型,包括:运用langchain大语言模型框架,将费率信息导入pdf或word文件中并应用递归向量值数据串文本分割器技术,将pdf或word文件内容分割成多个独立的段落块,并为每一块赋予唯一的编号,完成大语言费率模型的构建。

4.根据权利要求1所述的基于大语言模型的收费公路路径拟合方法,其特征在于,在步骤s1中,所述通过调用文本嵌入式模型将大语言费率模型数据信息存储于向量数据库,包括:通过调用文本嵌入式模型openai embeddings将多个独立的段落块映射到向量空间中,并存储于向量数据库中,向量数据库采用向量数组形式...

【专利技术属性】
技术研发人员:王锋宿晓丽
申请(专利权)人:甘肃紫光智能交通与控制技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1