下载一种面向NER的中文临床文本数据增强方法及装置的技术资料

文档序号:34433358

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种面向NER的中文临床文本数据增强方法及装置,通过数据预处理得到未标注数据和标签线性化处理的标注数据。使用未标注数据,通过掩盖文本中的部分信息,基于保留信息对掩盖部分进行预测,同时引入实体词级判别任务,进行基于片段的语言模型预...
该专利属于之江实验室所有,仅供学习研究参考,未经过之江实验室授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。