基于arm架构的文本向量化模型优化方法和装置制造方法及图纸

技术编号:43534663 阅读:21 留言:0更新日期:2024-12-03 12:18
本申请涉及一种基于arm架构的文本向量化模型优化方法和装置。所述方法包括:根据arm架构的计算能力,设计初始arm文本向量化模型;将转移用样本数据输入至已训练文本向量化模型,得到文本向量识别结果;根据文本向量识别结果,将已训练文本向量化模型的软标签迁移至初始arm文本向量化模型;在初始arm文本向量化模型的识别速度或/和识别准确度不能满足预设数值的情况下,根据识别速度和识别准确度,对初始模型层数以及初始模型维度进行调整,得到调整arm文本向量化模型;将调整arm文本向量化模型作为初始arm文本向量化模型后进行多次软标签迁移,得到目标arm文本向量化模型。本方法能够满足业务系统的实时处理需求。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种基于arm架构的文本向量化模型优化方法和装置


技术介绍

1、随着人工智能技术的发展,出现了文本向量化技术,文本向量化是自然语言处理(nlp)领域的一个重要组成部分,它涉及将文本数据转换为数值向量,以便计算机系统可以理解和处理。这个过程对于执行诸如文本分类、情感分析、机器翻译、问答系统、推荐系统等多种任务至关重要。

2、传统技术中的文本向量化模型通常是在高性能的x86架构处理器或gpu上开发和优化的,这些平台具有较高的计算能力和特定的优化指令集,能够高效地执行复杂的矩阵运算和深度学习任务。然而,当这些模型迁移到计算能力相对较弱的arm架构上时,由于arm处理器主频较低、缺乏高级优化指令集,模型的推理速度会显著下降,导致系统响应时间增加,导致无法满足业务系统的实时处理需求。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够满足业务系统的实时处理需求的基于arm架构的文本向量化模型优化方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

<本文档来自技高网...

【技术保护点】

1.一种基于arm架构的文本向量化模型优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述识别速度和所述识别准确度,对所述初始模型层数以及所述初始模型维度进行调整,得到调整arm文本向量化模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述模型层数调整量调整所述初始模型层数,以及根据所述模型维度调整量调整所述初始模型维度,得到所述调整arm文本向量化模型,包括:

4.根据权利要求3所述的方法,其特征在于,在所述根据所述模型测试数据,对所述中间arm文本向量化模型的模型层数和模型维度进行优化,得到所...

【技术特征摘要】

1.一种基于arm架构的文本向量化模型优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述识别速度和所述识别准确度,对所述初始模型层数以及所述初始模型维度进行调整,得到调整arm文本向量化模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述模型层数调整量调整所述初始模型层数,以及根据所述模型维度调整量调整所述初始模型维度,得到所述调整arm文本向量化模型,包括:

4.根据权利要求3所述的方法,其特征在于,在所述根据所述模型测试数据,对所述中间arm文本向量化模型的模型层数和模型维度进行优化,得到所述调整arm文本向量化模型步骤之后,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,在得到所述目标arm文本向量化模型之...

【专利技术属性】
技术研发人员:莫嘉琪林全郴梁寿愚赵必美张焕明曹尚李汉巨江佳佳张健军黄冠
申请(专利权)人:南方电网人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1