【技术实现步骤摘要】
本申请涉及企业识别,尤其涉及一种大数据企业识别方法、系统、电子设备及存储介质。
技术介绍
1、随着互联网和大数据技术的飞速发展,大数据和人工智能企业已成为推动社会生产力进步的关键力量。随着数字经济和信息化发展战略的深入实施,对大数据和人工智能企业的精准识别、监测和管理显得尤为重要。精准的企业识别不仅有助于政府及相关机构制定有效的政策措施,促进产业的健康发展,还能为企业提供更加精准的服务和支持,推动整个行业的繁荣。然而,现有的大数据和人工智能企业识别方法已无法满足行业快速、精准监测的需求。传统的识别方法,如基于国民经济行业分类的方法和人工审查认定法,存在主观性强、效率低下、识别准确度不高等问题。基于特征关键字的企业识别方法虽然在一定程度上提高了识别的自动化程度,但受限于关键字的设定和权重计算的主观性,其识别结果仍然存在一定的偏差。因此,如何精准地识别大数据企业是亟待解决的问题。
技术实现思路
1、本申请的主要目的在于克服现有技术的缺点与不足,提供一种大数据企业识别方法、系统、电子设备及存储介
...【技术保护点】
1.一种大数据企业识别方法,其特征在于,包括下述步骤:
2.根据权利要求1所述一种大数据企业识别方法,其特征在于,所述预处理包括:数据清洗、数据文本分词。
3.根据权利要求1所述一种大数据企业识别方法,其特征在于,还包括:
4.根据权利要求2所述一种大数据企业识别方法,其特征在于,所述数据文本分词是采用结巴分词分别对各个文本进行分词处理,步骤包括:
5.根据权利要求4所述一种大数据企业识别方法,其特征在于,所述分词处理后,还包括:删除文本中的标点符号、特殊符号以及删除停用词;所述停用词包括:功能词、符号、数字以及频率高但
...【技术特征摘要】
1.一种大数据企业识别方法,其特征在于,包括下述步骤:
2.根据权利要求1所述一种大数据企业识别方法,其特征在于,所述预处理包括:数据清洗、数据文本分词。
3.根据权利要求1所述一种大数据企业识别方法,其特征在于,还包括:
4.根据权利要求2所述一种大数据企业识别方法,其特征在于,所述数据文本分词是采用结巴分词分别对各个文本进行分词处理,步骤包括:
5.根据权利要求4所述一种大数据企业识别方法,其特征在于,所述分词处理后,还包括:删除文本中的标点符号、特殊符号以及删除停用词;所述停用词包括:功能词、符号、数字以及频率高但与文本主题信息相关度低的词。
6.根据权利要求1所述一种大...
【专利技术属性】
技术研发人员:郝新华,周敏,谭璐铭,方声泰,王安琪,陈锡金,吴寿盛,欧阳馨秋,韦长传,陶静远,黄晓芬,
申请(专利权)人:广州市城市规划勘测设计研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。