一种基于NLP技术的企业自动打标签模型生成方法、系统、设备以及存储介质技术方案

技术编号:35736729 阅读:28 留言:0更新日期:2022-11-26 18:39
一种基于NLP技术的企业自动打标签模型生成方法、系统、设备以及存储介质,属于人工智能技术领域,解决了现有打标签方式由于依赖于人工,存在效率低、正确率低、人工成本高以及专家主观因素占比过高的问题。所述方法包括以下步骤:步骤S1,抓取互联网企业信息,将其形成基础数据源;步骤S2,对基础数据源进行相应处理,利用NLP技术从处理后的基础数据源中提取企业关键信息;步骤S3,结合企业原有的标签数据,将企业关键信息和标签数据进行模型训练;步骤S4,结合模型训练结果,调整模型参数和变更输入数据,对模型进行多次迭代,生成训练模型;步骤S5,结合实际情况进行补充模型规则,生成自动打标签模型。打标签模型。打标签模型。

【技术实现步骤摘要】
一种基于NLP技术的企业自动打标签模型生成方法、系统、设备以及存储介质


[0001]本专利技术涉及人工智能
,具体涉及一种基于NLP技术的企业自动打标签模型生成方法、系统、设备以及存储介质。

技术介绍

[0002]目前对于企业进行分类、打标签通常都依赖于传统人工选择的方式,利用业务专家的经验进行打标签。存在效率低、人工成本高以及专家主观因素占比过高等缺点。并且随着时代的发展,越来越多的企业会出现多个标签的情况,而人工选择的方式非常容易出现遗漏、误判等情况的出现。而且目前需要打标签的企业数据越来越多,这就对传统的人工打标签方式造成了很大的困难。
[0003]综上所述,现有打标签方式存在的缺陷为:由于依赖于人工,存在效率低、正确率低、人工成本高以及专家主观因素占比过高。

技术实现思路

[0004]本专利技术解决了现有打标签方式由于依赖于人工,存在效率低、正确率低、人工成本高以及专家主观因素占比过高的问题。
[0005]本专利技术所述的一种基于NLP技术的企业自动打标签模型生成方法,包括以下步骤:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NLP技术的企业自动打标签模型生成方法,其特征在于,包括以下步骤:步骤S1,抓取互联网企业信息,将其形成基础数据源;步骤S2,对基础数据源进行相应处理,利用NLP技术从处理后的基础数据源中提取企业关键信息;步骤S3,结合企业原有的标签数据,将企业关键信息和标签数据进行模型训练;步骤S4,结合模型训练结果,调整模型参数和变更输入数据,对模型进行多次迭代,生成训练模型;步骤S5,结合实际情况进行补充模型规则,生成自动打标签模型。2.根据权利要求1所述的一种基于NLP技术的企业自动打标签模型生成方法,其特征在于,所述的步骤S1中,所述的抓取互联网企业信息的方式包括网络爬虫采集和历史企业标签库数据。3.根据权利要求1所述的一种基于NLP技术的企业自动打标签模型生成方法,其特征在于,所述的步骤S2中,所述的基础数据源进行相应处理,包括以下步骤:步骤S201,将基础数据源中的数据进行数据清洗,去除数据中的干扰项;步骤S202,将清洗后的基础数据源中的数据进行分词;步骤S203,根据步骤S202分词结果进行专业词汇和停用词汇的管理补充。4.根据权利要求1所述的一种基于NLP技术的企业自动打标签模型生成方法,其特征在于,所述的步骤S2中,所述的利用NLP技术从处理后的基础数据源中提取企业关键信息的部分专业词汇进行权重调整。5.根据权利要求1所述的一种基于NLP技术的企业自动打标签模型生成方法,其特征在于,所述的步骤S3中,所述的模型训练...

【专利技术属性】
技术研发人员:张巍元陈作星孙宇姜艳萍吕海玉葛振兴王艳彬
申请(专利权)人:吉林省吉林祥云信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1