一种基于AI大语言模型的专家与项目匹配方法组成比例

技术编号:44334420 阅读:21 留言:0更新日期:2025-02-18 20:43
本发明专利技术公开了一种基于AI大语言模型的专家与项目匹配方法,包括如下步骤:S1)数据预处理:对项目和专家的信息进行数据清洗、去噪、分词和标注处理;S2)文本表示与特征提取:利用AI大语言模型对项目和专家的文本信息进行向量化表示,并提取关键特征;S3)使用多个向量模型计算项目和专家之间的相似度情况,取不一致数据的合集进行rerank重排序,如果不符合预期,则进行业务相似度雷达图的多维计算,通过加权方式推荐最匹配的专家进行项目评审;S4)结果优化与反馈:根据用户反馈和模型自我学习,通过迭代训练和调整参数,不断优化匹配算法和结果。本发明专利技术能够提高匹配的准确性和效率,确保推荐最匹配的专家进行项目评审。

【技术实现步骤摘要】

:智慧城市服务支撑技术行业领域:乡村规划与建设研究方向:国土空间规划,规划实施研究成果:人工智能驱动的规划管理办法评审经验:计算机系统规划设计相关项目评审超过16次提取待评审项目在的特征为“计算机相关”。使用baai/bge-large-zh-v1.5模型来计算出两个专家对应项目的相关性,首先,将第7号专家和第1号专家在6个领域的特征值通过模型向量化,获得一个向量矩阵embeddings_1,然后将“计算机相关”向量化得到另外一个向量矩阵embeddings_2,采用similarity=embeddings_1@embeddings_2.t来计算相似度。embeddings_1的形状为(m=12,d=1024),其中m是第一个集合中数据点的数量,d是嵌入向量的维度。embeddings_2的形状为(n=1,d=1024),其中n是第二个集合中数据点的数量,d同样表示嵌入向量的维度。embeddings_2.t是embeddings_2的转置矩阵,其形状变为(d=1024,n=1)。当执行embeddings_1@embeddings_2.t时,这实际上是在进行矩阵乘法。在pyt本文档来自技高网...

【技术保护点】

1.一种基于AI大语言模型的专家与项目匹配方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于AI大语言模型的专家与项目匹配方法,其特征在于,所述步骤S1中数据清洗包括:

3.如权利要求1所述的基于AI大语言模型的专家与项目匹配方法,其特征在于,所述步骤S1中数据去噪包括:移除文本中的HTML标签、特殊字符和无关标点符号,并去除停用词。

4.如权利要求1所述的基于AI大语言模型的专家与项目匹配方法,其特征在于,所述步骤S1根据中文分词工具对项目描述和专家简介进行分词处理,并对专家研究领域和项目技术关键词进行标注。

>5.如权利要求1所...

【技术特征摘要】

1.一种基于ai大语言模型的专家与项目匹配方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于ai大语言模型的专家与项目匹配方法,其特征在于,所述步骤s1中数据清洗包括:

3.如权利要求1所述的基于ai大语言模型的专家与项目匹配方法,其特征在于,所述步骤s1中数据去噪包括:移除文本中的html标签、特殊字符和无关标点符号,并去除停用词。

4.如权利要求1所述的基于ai大语言模型的专家与项目匹配方法,其特征在于,所述步骤s1根据中文分词工具对项目描述和专家简介进行分词处理,并对专家研究领域和项目技术关键词进行标注。

5.如权利要求1所述的基于ai大语言模型的专家与项目匹配方法,其特征在于,所述步骤s2中的关键特征包括项目和专家的技术领域、行业领域、科学领域,以及专家的研究方向、研究成果、评审经验。

6.如权利要求1所述的基于ai大语言模型的专家与项目匹配方法,其特征在于,所述步骤s3使用n个文本嵌入大模型作为向量模型计算相似度,当n个向量模型计算的相似度结果不一致时,取合集,并利用rerank模型对所取合集进行相关度排序;计算公式如下:

7.如权利要求6所述的基于ai大语言模型的专家与项目匹配方法,其特征在于,n的取值为2,所述步骤s3使用的向量模型为openai的text-ebedding-ada...

【专利技术属性】
技术研发人员:刘氢朱俊伟叶有灿李伟诚钱枫
申请(专利权)人:上海市大数据中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1