企业简称生成方法和装置制造方法及图纸

技术编号:42627366 阅读:47 留言:0更新日期:2024-09-06 01:29
本申请涉及自然语言处理技术领域,特别是涉及一种企业简称生成方法和装置。所述方法包括:获取待处理的企业名称数据;对企业名称数据进行命名实体识别,得到企业名称数据在多个实体类别下的实体识别结果;根据大型语言模型的训练语料,采用多个实体类别下的实体识别结果构建与大型语言模型对应的提示指令数据;将提示指令数据输入至大型语言模型,得到大型语言模型生成的与企业名称数据对应的企业简称数据。采用本方法能够利用由多个实体类别下的实体识别结果构建的提示指令数据提高大型语言模型的数据处理粒度以及大型语言模型在处理当前的企业名称数据对应的简称生成任务的可解释性,从而提高企业简称生成方法的准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理,特别是涉及一种企业简称生成方法和装置


技术介绍

1、企业名称一般包括企业的商号、业务属性、地区、组织形式等信息。为了便于传播与宣传,通常会根据企业名称中的信息内容,抽取一个符合企业需求的合理的企业简称作为企业的代名词。

2、传统技术中,可以通过对企业名称中的每个汉字进行建模,得到与每个汉字对应的词向量。将词向量输入至长短期记忆网络进行预测,输出每个汉字对应的隐藏层状态向量。使用条件随机场网络对每个汉字对应的隐藏层状态向量进行打分,得到与企业名称对应的二元标注集。根据二元标注集确定企业名称中的每个汉字是否需要保留,从而形成对应的企业简称。

3、然而,采用传统技术中的企业简称生成方法时,由于基于单个的汉字来构建二元标注集,容易出现过拟合的情况,从而导致企业简称生成的准确性较低。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种准确性更高的企业简称生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种企本文档来自技高网...

【技术保护点】

1.一种企业简称生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述大型语言模型的预训练方式包括:

3.根据权利要求2所述的方法,其特征在于,所述利用所述企业名称样本、所述实体识别样本和所述企业简称样本,结合简称生成任务的业务需求信息,构建所述训练语料,包括:

4.根据权利要求2所述的方法,其特征在于,所述将所述提示指令数据输入至所述大型语言模型,得到所述大型语言模型生成的与所述企业名称数据对应的企业简称数据,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述企业名称数据进行命名实体识别,得到所述企...

【技术特征摘要】

1.一种企业简称生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述大型语言模型的预训练方式包括:

3.根据权利要求2所述的方法,其特征在于,所述利用所述企业名称样本、所述实体识别样本和所述企业简称样本,结合简称生成任务的业务需求信息,构建所述训练语料,包括:

4.根据权利要求2所述的方法,其特征在于,所述将所述提示指令数据输入至所述大型语言模型,得到所述大型语言模型生成的与所述企业名称数据对应的企业简称数据,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述企业名称数据进行命名实体识别,得到所述企业名称数据在多个实体类别下的实体识别结果,包括:

6.根据权利要求1...

【专利技术属性】
技术研发人员:皮乾东陈汝龙曹梦远孙梦林
申请(专利权)人:企查查科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1