下载基于预训练语言模型的中文临床文本分词方法的技术资料

文档序号:34202436

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明属于计算机数据挖掘与应用领域,主要是实现医疗临床文本领域电子病历的分词算法。本发明主要通过传统LSTM和CRF结合预训练语言模型以及无标注数据和少量标注数据,训练得到一个领域适应性较强的语言模型,最终达到在临床文本上分词取得较好的效果...
该专利属于中南大学所有,仅供学习研究参考,未经过中南大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。