标准文献产业分类方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:41579102 阅读:19 留言:0更新日期:2024-06-06 23:55
本申请实施例本申请涉及人工智能技术领域,具体地,涉及一种标准文献产业分类方法、装置、计算机设备和存储介质,该标准文献产业分类方法应用于预先构建的标准文献产业分类模型系统,其中,所述标准文献产业分类模型系统至少包括:大语言模型和分类模型,该方法包括:获取待分类标准文献文本;调用预先构建的大语言模型对待分类标准文献文本进行语义分析,得到所述待分类标准文献文本的语义分析结果;调用预先构建的分类模型基于所述语义分析结果对所述标准文献文本进行分类,确定所述标准文献文本对应的目标产业类别。提供了一种可以对标准文献文本进行准确可靠的行业类别分类方法。

【技术实现步骤摘要】

本申请涉及人工智能,具体地,涉及一种标准文献产业分类方法、装置、计算机设备和存储介质


技术介绍

1、标准文献产业分类问题与常见的分类问题不同,在常见的分类任务中,所涉及数据的类别通常有明确的、公认的标准。例如在经典的猫狗分类任务,以及数字分类任务中,人们可以通过常识对样本所属的标签做出判断。对于大多数的样本,其标签都是明确的,可以通过普通人群的时间和劳动加以标注。但是在标准文献产业分类的任务中,待分类的样本是科技标准文献,同时,其涉及的学科领域也十分复杂。科技文献的专业性,广度和深度,使得通过人力对大量的文本数据集进行数据标注变得十分困难。

2、当今大数据时代,标准等文献呈现爆炸性增长,给文献的高效管理与服务带来了巨大挑战。由于产业的不断演进和多样化,传统的标准文献产业分类体系无法灵活适应不断变化的产业需求,导致了标准文献产业分类与实际产业之间的鸿沟。尤其在信息的时代该问题显著突显,且传统标准文献产业分类的转型升级困难。

3、对于目前标准文献产业分类任务仍然面临以下问题:(1)待分类的产业目标数据中有大量与目标产业无关的内容,且由本文档来自技高网...

【技术保护点】

1.一种标准文献产业分类方法,其特征在于,应用于预先构建的标准文献产业分类模型系统,其中,所述标准文献产业分类模型系统至少包括:大语言模型和分类模型,所述方法包括:

2.根据权利要求1所述的标准文献产业分类方法,其特征在于,在所述获取待分类标准文献文本之后,所述方法还包括:

3.根据权利要求1所述的标准文献产业分类方法,其特征在于,所述大语言模型至少包括:归一化层级、多头注意力处理层级和第一计算层级;对应的,所述调用预先构建的大语言模型对待分类标准文献文本进行语义分析,得到所述待分类标准文献文本的语义分析结果,包括:

4.根据权利要求3所述的标准文献产...

【技术特征摘要】

1.一种标准文献产业分类方法,其特征在于,应用于预先构建的标准文献产业分类模型系统,其中,所述标准文献产业分类模型系统至少包括:大语言模型和分类模型,所述方法包括:

2.根据权利要求1所述的标准文献产业分类方法,其特征在于,在所述获取待分类标准文献文本之后,所述方法还包括:

3.根据权利要求1所述的标准文献产业分类方法,其特征在于,所述大语言模型至少包括:归一化层级、多头注意力处理层级和第一计算层级;对应的,所述调用预先构建的大语言模型对待分类标准文献文本进行语义分析,得到所述待分类标准文献文本的语义分析结果,包括:

4.根据权利要求3所述的标准文献产业分类方法,其特征在于,所述大语言模型还包括:线性前反馈层级和第二计算层级;对应的,所述调用预先构建的大语言模型对待分类标准文献文本进行语义分析,得到所述待分类标准文献文本的语义分析结果,包括:

5.根据权利要求1所述的标准文献产业分类方法,其特征在于,所述调用预先构建的分类模...

【专利技术属性】
技术研发人员:刘春卉
申请(专利权)人:中国标准化研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1