温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种专有领域语料模型构建方法、计算机设备及存储介质,该方法包括以下步骤:步骤一、语料收集及预处理:通过数据清洗获取充足的纯净无监督语料;步骤二、词频及逆文本频率指数分析:通过TF‑IDF统计方法识别出纯净无监督语料中的重要程度较...该专利属于达而观数据(成都)有限公司所有,仅供学习研究参考,未经过达而观数据(成都)有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种专有领域语料模型构建方法、计算机设备及存储介质,该方法包括以下步骤:步骤一、语料收集及预处理:通过数据清洗获取充足的纯净无监督语料;步骤二、词频及逆文本频率指数分析:通过TF‑IDF统计方法识别出纯净无监督语料中的重要程度较...