下载一种并行化的电力设备缺陷文本分类方法的技术资料

文档序号:17939795

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种并行化的电力设备缺陷文本分类方法,将领域词库加入到用户词典中,对缺陷案例进行预处理,进行分词和去停用词;利用爬虫算法,收集电网故障案例的文本语料,利用Spark的word2vec进行训练,获取该领域的词向量表示;将获取的缺陷...
该专利属于国网山东省电力公司电力科学研究院;北京邮电大学;国家电网公司所有,仅供学习研究参考,未经过国网山东省电力公司电力科学研究院;北京邮电大学;国家电网公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。