【技术实现步骤摘要】
本申请涉及自然语言处理,特别是涉及一种企业简称生成方法和装置。
技术介绍
1、企业名称一般包括企业的商号、业务属性、地区、组织形式等信息。为了便于传播与宣传,通常会根据企业名称中的信息内容,抽取一个符合企业需求的合理的企业简称作为企业的代名词。
2、传统技术中,可以通过对企业名称中的每个汉字进行建模,得到与每个汉字对应的词向量。将词向量输入至长短期记忆网络进行预测,输出每个汉字对应的隐藏层状态向量。使用条件随机场网络对每个汉字对应的隐藏层状态向量进行打分,得到与企业名称对应的二元标注集。根据二元标注集确定企业名称中的每个汉字是否需要保留,从而形成对应的企业简称。
3、然而,采用传统技术中的企业简称生成方法时,由于基于单个的汉字来构建二元标注集,容易出现过拟合的情况,从而导致企业简称生成的准确性较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种准确性更高的企业简称生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面
...【技术保护点】
1.一种企业简称生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述大型语言模型的预训练方式包括:
3.根据权利要求2所述的方法,其特征在于,所述利用所述企业名称样本、所述实体识别样本和所述企业简称样本,结合简称生成任务的业务需求信息,构建所述训练语料,包括:
4.根据权利要求2所述的方法,其特征在于,所述将所述提示指令数据输入至所述大型语言模型,得到所述大型语言模型生成的与所述企业名称数据对应的企业简称数据,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述企业名称数据进行命名
...【技术特征摘要】
1.一种企业简称生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述大型语言模型的预训练方式包括:
3.根据权利要求2所述的方法,其特征在于,所述利用所述企业名称样本、所述实体识别样本和所述企业简称样本,结合简称生成任务的业务需求信息,构建所述训练语料,包括:
4.根据权利要求2所述的方法,其特征在于,所述将所述提示指令数据输入至所述大型语言模型,得到所述大型语言模型生成的与所述企业名称数据对应的企业简称数据,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述企业名称数据进行命名实体识别,得到所述企业名称数据在多个实体类别下的实体识别结果,包括:
6.根据权利要求1...
【专利技术属性】
技术研发人员:皮乾东,陈汝龙,曹梦远,孙梦林,
申请(专利权)人:企查查科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。