【技术实现步骤摘要】
本专利技术涉及金融科技及人工智能,尤其涉及一种实体识别方法、装置、电子设备及可读存储介质。
技术介绍
1、随着人工智能的发展,实体识别广泛应用于不同领域,可以提高数据识别的效率,例如,在银行和保险业务中,用户信息录入和核对等业务上存在着很多消耗人力的重复性工作,而实体识别技术可以自动识别给定数据文本中的命名实体信息,提高了信息统计的效率和准确性。
2、现有技术中,实体识别领域自适应方法已经取得了一定的进展,但仍存在着一些问题,包括:1、大多数自适应方法都是从单一源领域迁移到目标领域,但当目标领域与源领域差异较大时,迁移的效果并不理想,导致实体识别的准确率较低,例如以寿险业务中用户信息为目标领域,新闻报道、科技文献等不同源领域的数据迁移效果较差;2、当前基于预训练的自适应方法通常需要大规模的目标领域或相关领域无标注语料对语言模型进行预训练,但并非所有目标领域都可以满足这一条件,因此训练数据的质量难以保证,进而影响模型训练,导致实体识别准确率较低。
技术实现思路
1、本专利技术提供
...【技术保护点】
1.一种实体识别方法,其特征在于,所述方法包括:
2.如权利要求1所述的实体识别方法,其特征在于,所述基于所述原始训练集合中的标签对所述原始训练集合进行数据增强处理,得到标准训练集合,包括:
3.如权利要求1所述的实体识别方法,其特征在于,所述基于所述标准训练集合及所述多源训练集合对预构建的第一语言模型进行自适应训练,得到第一实体识别模型,包括:
4.如权利要求1中所述的实体识别方法,其特征在于,所述利用所述标准训练集合及所述多源训练集合对预构建的第二语言模型进行贡献度领域迁移训练,得到第二实体识别模型,包括:
5.如权
...【技术特征摘要】
1.一种实体识别方法,其特征在于,所述方法包括:
2.如权利要求1所述的实体识别方法,其特征在于,所述基于所述原始训练集合中的标签对所述原始训练集合进行数据增强处理,得到标准训练集合,包括:
3.如权利要求1所述的实体识别方法,其特征在于,所述基于所述标准训练集合及所述多源训练集合对预构建的第一语言模型进行自适应训练,得到第一实体识别模型,包括:
4.如权利要求1中所述的实体识别方法,其特征在于,所述利用所述标准训练集合及所述多源训练集合对预构建的第二语言模型进行贡献度领域迁移训练,得到第二实体识别模型,包括:
5.如权利要求4所述的实体识别方法,其特征在于,所述基于所述预测标签、所...
【专利技术属性】
技术研发人员:于凤英,王健宗,程宁,
申请(专利权)人:平安创科科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。