The invention discloses an enterprise information analysis method based on big data, which relates to the technical field of enterprise information analysis method. The following steps are included: Step 1: collect the web data of the enterprise, process the enterprise information according to the name of the enterprise which the user input, and extract the web pages related to the enterprise. Step two: obtain the user's search and use information through the user login information, and then search for the user's interest point and the user's use habit. Make a judgment and select the web pages related to the enterprise in step 1; step three: set the web page collection for the web pages that are selected in step 2. By sorting the collection of web pages according to the user's interest points and the user's search and use habits, the invention determines the proportion of the individual information in the collection of a single web page, so that the user can obtain information that matches its own interest points.
【技术实现步骤摘要】
一种基于大数据的企业信息分析方法
本专利技术属于企业信息分析方法
,特别是涉及一种基于大数据的企业信息分析方法。
技术介绍
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。目前,现有的企业信息分析方法在企业发展定位方面的分析不够全面,且在分析过程中,过于依赖用户的已知兴趣点,长久之后,会造成用户对单一兴趣点的疲劳反应。
技术实现思路
本专利技术的目的在于提供一种基于大数据的企业信息分析方法,根据该企业的销售总额确定该企业与平均值之间的市场份额差距,便于企业对自身发展状况的定位,以便制定未来发展战略;通过随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,以便于采集已知用户兴趣点之外的兴趣点,解决了现有的企业信息分析方法在企业发展定位方面的分析不够全面的问题。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为一种 ...
【技术保护点】
1.一种基于大数据的企业信息分析方法,其特征在于,包括以下步骤:步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:A:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;B:根据网页搜索热度对每一网页集合中的网页进行规划。
【技术特征摘要】
1.一种基于大数据的企业信息分析方法,其特征在于,包括以下步骤:步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:A:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;B:根据网页搜索热度对每一网页集合中的网页进行规划。2.根据权利要求1所述的一种基于大数据的企业信息分析方法,其特征在于,所述步骤一中,对用户所输入的企业名称进行处理时包括以下步骤:SS01:根据该企业的服务类型和...
【专利技术属性】
技术研发人员:王国庆,
申请(专利权)人:合肥和钧正策信息技术有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。