一种基于大数据的企业信息分析方法技术

技术编号:18445144 阅读:2 留言:0更新日期:2018-07-14 10:28
本发明专利技术公开了一种基于大数据的企业信息分析方法,涉及企业信息分析方法技术领域。包括以下步骤:步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并提取与该企业相关的网页;步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并对步骤一中与该企业相关的网页进行筛选;步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理。本发明专利技术通过根据用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重,便于用户获取与自身兴趣点相匹配的信息。

An enterprise information analysis method based on large data

The invention discloses an enterprise information analysis method based on big data, which relates to the technical field of enterprise information analysis method. The following steps are included: Step 1: collect the web data of the enterprise, process the enterprise information according to the name of the enterprise which the user input, and extract the web pages related to the enterprise. Step two: obtain the user's search and use information through the user login information, and then search for the user's interest point and the user's use habit. Make a judgment and select the web pages related to the enterprise in step 1; step three: set the web page collection for the web pages that are selected in step 2. By sorting the collection of web pages according to the user's interest points and the user's search and use habits, the invention determines the proportion of the individual information in the collection of a single web page, so that the user can obtain information that matches its own interest points.

【技术实现步骤摘要】
一种基于大数据的企业信息分析方法
本专利技术属于企业信息分析方法
,特别是涉及一种基于大数据的企业信息分析方法。
技术介绍
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。目前,现有的企业信息分析方法在企业发展定位方面的分析不够全面,且在分析过程中,过于依赖用户的已知兴趣点,长久之后,会造成用户对单一兴趣点的疲劳反应。
技术实现思路
本专利技术的目的在于提供一种基于大数据的企业信息分析方法,根据该企业的销售总额确定该企业与平均值之间的市场份额差距,便于企业对自身发展状况的定位,以便制定未来发展战略;通过随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,以便于采集已知用户兴趣点之外的兴趣点,解决了现有的企业信息分析方法在企业发展定位方面的分析不够全面的问题。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为一种基于大数据的企业信息分析方法,包括以下步骤:步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:A:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;B:根据网页搜索热度对每一网页集合中的网页进行规划。进一步地,所述步骤一中,对用户所输入的企业名称进行处理时包括以下步骤:SS01:根据该企业的服务类型和企业产品确定该企业所经营行业,并对该行业进行行业集中度分析;SS02:将行业集中度的分析结果进行平均值计算,并根据该企业的销售总额确定该企业与平均值之间的市场份额差距。进一步地,所述步骤二中用户搜索使用信息包括用户的web访问日志和cookie。进一步地,所述步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为对每一网络集合根据搜索热度的递减趋势进行显示。进一步地,所述步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为:随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,然后采集用户对该网页的关注度。本专利技术具有以下有益效果:1、本专利技术通过根据该企业的销售总额确定该企业与平均值之间的市场份额差距,便于企业对自身发展状况的定位,以便制定未来发展战略。2、本专利技术通过根据用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重,便于用户获取与自身兴趣点相匹配的信息。3、本专利技术通过随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,以便于采集已知用户兴趣点之外的兴趣点。当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。具体实施方式下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。本专利技术为一种基于大数据的企业信息分析方法,包括以下步骤:步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:A:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;B:根据网页搜索热度对每一网页集合中的网页进行规划。其中,步骤一中,对用户所输入的企业名称进行处理时包括以下步骤:SS01:根据该企业的服务类型和企业产品确定该企业所经营行业,并对该行业进行行业集中度分析;SS02:将行业集中度的分析结果进行平均值计算,并根据该企业的销售总额确定该企业与平均值之间的市场份额差距。其中,步骤二中用户搜索使用信息包括用户的web访问日志和cookie。其中,步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为对每一网络集合根据搜索热度的递减趋势进行显示。其中,步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为:随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,然后采集用户对该网页的关注度。在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。以上公开的本专利技术优选实施例只是用于帮助阐述本专利技术。优选实施例并没有详尽叙述所有的细节,也不限制该专利技术仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本专利技术的原理和实际应用,从而使所属
技术人员能很好地理解和利用本专利技术。本专利技术仅受权利要求书及其全部范围和等效物的限制。本文档来自技高网
...

【技术保护点】
1.一种基于大数据的企业信息分析方法,其特征在于,包括以下步骤:步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:A:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;B:根据网页搜索热度对每一网页集合中的网页进行规划。

【技术特征摘要】
1.一种基于大数据的企业信息分析方法,其特征在于,包括以下步骤:步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:A:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;B:根据网页搜索热度对每一网页集合中的网页进行规划。2.根据权利要求1所述的一种基于大数据的企业信息分析方法,其特征在于,所述步骤一中,对用户所输入的企业名称进行处理时包括以下步骤:SS01:根据该企业的服务类型和...

【专利技术属性】
技术研发人员:王国庆
申请(专利权)人:合肥和钧正策信息技术有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1