【技术实现步骤摘要】
本专利技术涉及自然语言处理,具体涉及一种基于大语言模型与语义融合的制度检索推荐方法及系统。
技术介绍
1、制度文件检索是企业安全管理制度体系中的重要组成部分,其通过系统化的方法和工具,实现对相关制度文件的高效检索和管理,以确保企业在安全管理方面能够快速准确地获取必要信息,从而有效应对潜在的安全风险和问题。然而,目前的制度检索和管理存在制度文件数量多、制度内容繁多、制度文件多以pdf、word等文本型格式发放和存储,文件或者条款间的关联关系缺少智能化分析手段等问题。现有文本检索方法存在受限于文本长度、不能够充分理解语义、计算资源消耗大、存在数据泄露风险等问题。所以急需一种高效、精准、安全,能够充分表征文件、条款、附件间语义链接关系的智能化制度文件检索与推荐方法。
2、早期的文本检索方法主要基于手工设计的规则和关键词匹配,此类方法受限于规则的复杂性和灵活性,对于语义理解和复杂查询的处理能力有限。向量空间模型(vectorspace model,vsm)引入向量空间模型的思想,文档和查询被表示为向量,这种基于统计的方法在计算相似性
...【技术保护点】
1.一种基于大语言模型与语义融合的制度检索推荐方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,面向制度文件检索与推荐应用需求,构建制度文件知识图谱模式层,具体包括:
3.根据权利要求2所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,对制度文件进行统一格式转换,基于正则表达式对制度文本文件进行文本分割,获得各条款和附件的文本文件,具体包括:
4.根据权利要求3所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,基于大语言模型与传统语义融合的关键词提取方法
...【技术特征摘要】
1.一种基于大语言模型与语义融合的制度检索推荐方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,面向制度文件检索与推荐应用需求,构建制度文件知识图谱模式层,具体包括:
3.根据权利要求2所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,对制度文件进行统一格式转换,基于正则表达式对制度文本文件进行文本分割,获得各条款和附件的文本文件,具体包括:
4.根据权利要求3所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,基于大语言模型与传统语义融合的关键词提取方法对各条款和附件文本进行关键词提取,具体包括:
5.根据权利要求4所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,基于模式层和关键词提取结果构建制度文件知识图谱数据层,采用neo4j图数据库规范化存储制度文件数据,具体包括:
6.根据权利要求5所述的基于大语言模型与语义融合的制度检索推荐方法,其特征在于,基于检...
【专利技术属性】
技术研发人员:马小平,严晗,赵汝豪,贾利民,李晴,陈菲,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。