实体识别方法、装置、设备及存储介质制造方法及图纸

技术编号:40103974 阅读:17 留言:0更新日期:2024-01-23 18:08
本发明专利技术涉及金融科技领域的人工智能技术,揭露了一种实体识别方法,包括:基于原始训练集合中的标签进行数据增强处理,得到标准训练集合,获取多源领域的多源训练集合,基于标准训练集合及所述多源训练集合对预构建的第一语言模型进行自适应训练,得到第一实体识别模型;利用标准训练集合及多源训练集合对预构建的第二语言模型进行贡献度领域迁移训练,得到第二实体识别模型,利用第一实体识别模型及所述第二实体识别模型对目标领域的待识别数据进行实体识别,得到实体识别结果。本发明专利技术还涉及区块链技术,所述实体识别结果可存储在区块链的节点中。本发明专利技术还提出一种实体识别装置、电子设备以及可读存储介质。本发明专利技术可以提高实体识别的准确率。

【技术实现步骤摘要】

本专利技术涉及金融科技及人工智能,尤其涉及一种实体识别方法、装置、电子设备及可读存储介质。


技术介绍

1、随着人工智能的发展,实体识别广泛应用于不同领域,可以提高数据识别的效率,例如,在银行和保险业务中,用户信息录入和核对等业务上存在着很多消耗人力的重复性工作,而实体识别技术可以自动识别给定数据文本中的命名实体信息,提高了信息统计的效率和准确性。

2、现有技术中,实体识别领域自适应方法已经取得了一定的进展,但仍存在着一些问题,包括:1、大多数自适应方法都是从单一源领域迁移到目标领域,但当目标领域与源领域差异较大时,迁移的效果并不理想,导致实体识别的准确率较低,例如以寿险业务中用户信息为目标领域,新闻报道、科技文献等不同源领域的数据迁移效果较差;2、当前基于预训练的自适应方法通常需要大规模的目标领域或相关领域无标注语料对语言模型进行预训练,但并非所有目标领域都可以满足这一条件,因此训练数据的质量难以保证,进而影响模型训练,导致实体识别准确率较低。


技术实现思路

1、本专利技术提供一种实体识别方法、装本文档来自技高网...

【技术保护点】

1.一种实体识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的实体识别方法,其特征在于,所述基于所述原始训练集合中的标签对所述原始训练集合进行数据增强处理,得到标准训练集合,包括:

3.如权利要求1所述的实体识别方法,其特征在于,所述基于所述标准训练集合及所述多源训练集合对预构建的第一语言模型进行自适应训练,得到第一实体识别模型,包括:

4.如权利要求1中所述的实体识别方法,其特征在于,所述利用所述标准训练集合及所述多源训练集合对预构建的第二语言模型进行贡献度领域迁移训练,得到第二实体识别模型,包括:

5.如权利要求4所述的实体识...

【技术特征摘要】

1.一种实体识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的实体识别方法,其特征在于,所述基于所述原始训练集合中的标签对所述原始训练集合进行数据增强处理,得到标准训练集合,包括:

3.如权利要求1所述的实体识别方法,其特征在于,所述基于所述标准训练集合及所述多源训练集合对预构建的第一语言模型进行自适应训练,得到第一实体识别模型,包括:

4.如权利要求1中所述的实体识别方法,其特征在于,所述利用所述标准训练集合及所述多源训练集合对预构建的第二语言模型进行贡献度领域迁移训练,得到第二实体识别模型,包括:

5.如权利要求4所述的实体识别方法,其特征在于,所述基于所述预测标签、所...

【专利技术属性】
技术研发人员:于凤英王健宗程宁
申请(专利权)人:平安创科科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1