一种客户信息挖掘方法、装置、设备以及存储介质制造方法及图纸

技术编号:15895411 阅读:23 留言:0更新日期:2017-07-28 19:51
本发明专利技术实施例公开了一种客户信息挖掘方法、装置、设备及存储介质。所述方法包括:确定预设行业的检索式信息;根据所述预设行业的检索式信息通过搜索引擎进行检索,并从检索结果中抓取网页信息;从所述网页信息中确定目标网站;获取所述目标网站的候选网页集合,根据内容过滤技术对所述候选网页集合中的网页进行过滤及分析,获取目标客户的画像特征。本发明专利技术实施例通过采用上述技术方案,能够从海量信息中精确锁定目标客户,提升客户量,并获取客户的画像特征信息,以保证后续营销的精准性。

Customer information mining method, device, equipment and storage medium

The embodiment of the invention discloses a customer information mining method, a device, a device and a storage medium. The method includes: determining the type of information retrieval based on preset industry; retrieval type information is retrieved by the search engine the preset industry, and grasping from the search results page information; determining the target site from the web information; acquiring the target candidate set according to the web site, content filtering and filtering technology analysis on the set of candidate web pages in portrait, acquisition of target customers. By adopting the technical proposal, the embodiment of the invention can accurately lock the target customers from the mass information, enhance the customer quantity, and obtain the portrait information of the customers, so as to ensure the accuracy of the follow-up marketing.

【技术实现步骤摘要】
一种客户信息挖掘方法、装置、设备以及存储介质
本专利技术实施例涉及信息处理
,尤其涉及一种客户信息挖掘方法、装置、设备以及存储介质。
技术介绍
随着电子商务时代的不断发展,市场竞争日益加剧,在营销过程中,客户资源的竞争从来没有停止过,不断挖掘潜在客户,并将潜在客户转化为现实客户,对企业获得更多效益及增强市场竞争力具有重要意义。所谓潜在客户,是指对某类产品或服务存在需求且具备购买能力的待开发客户,这类客户与企业存在着销售合作机会,经过企业及销售人员的努力,可以把潜在客户转变为现实客户。通过挖掘客户信息来确定潜在客户,对于扩展企业营销范围具有重要意义。现有的获取潜在客户信息的方法,一般通过举办市场活动、电话咨询或客户访谈等多种方式获得客户信息,并进行营销跟进,但现有方法得到的客户信息质量参差不齐,有些客户信息甚至不具备营销价值,无法实现精确锁定潜在客户。
技术实现思路
本专利技术实施例提供一种客户信息挖掘方法、装置、设备以及存储介质,以解决现有客户信息挖掘方法无法精确锁定潜在客户的技术缺陷。第一方面,本专利技术实施例提供了一种客户信息挖掘方法,包括:确定预设行业的检索式信息;根据所述预设行业的检索式信息通过搜索引擎进行检索,并从检索结果中抓取网页信息;从所述网页信息中确定目标网站;获取所述目标网站的候选网页集合,根据内容过滤技术对所述候选网页集合中的网页进行过滤及分析,获取目标客户的画像特征。第二方面,本专利技术实施例还提供了一种客户信息挖掘装置,包括:检索式确定模块,用于确定预设行业的检索式信息;检索模块,用于根据所述预设行业的检索式信息通过搜索引擎进行检索,并从检索结果中抓取网页信息;目标网站确定模块,用于从所述网页信息中确定目标网站;信息挖掘模块,用于获取所述目标网站的候选网页集合,根据内容过滤技术对所述候选网页集合中的网页进行过滤及分析,获取目标客户的画像特征。第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本专利技术实施例中任一所述的客户信息挖掘方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的客户信息挖掘方法。本专利技术实施例提供的技术方案,基于搜索引擎对预设行业的检索式信息进行检索,从检索结果中抓取网页信息并确定目标网站,通过对目标网站对应的网页集合进行筛选和分析,得到目标客户的画像特征信息。本专利技术实施例通过采用上述技术方案,能够从海量信息中精确锁定目标客户,提升客户量,并获取客户的画像特征信息,以保证后续营销的精准性。附图说明图1为本专利技术实施例一提供的一种客户信息挖掘方法的流程示意图;图2为本专利技术实施例二提供的一种客户信息挖掘方法的流程示意图;图3为本专利技术实施例三提供的一种客户信息挖掘方法的流程示意图;图4为本专利技术实施例四提供的一种客户信息挖掘方法的流程示意图;图5为本专利技术实施例五提供的一种客户信息挖掘装置的结构示意图;图6为本专利技术实施例六提供的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程示意图描绘的处理或方法。虽然流程示意图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1为本专利技术实施例一提供的一种客户信息挖掘方法的流程示意图。本实施例的方法可以由客户信息挖掘装置来执行,该装置可通过硬件和/或软件的方式实现,该装置可集成在具有客户信息挖掘功能的服务器或者终端设备中,且本实施例提供的方法一般可适用于挖掘客户信息的情况。如图1所示,本实施例的方法包括:110、确定预设行业的检索式信息。示例性的,行业一般是指按生产同类产品、具有相同工艺过程或提供同类劳动服务划分的经济活动类别,如饮食行业、服装行业、机械行业、金融行业、移动互联网行业等等,也可以细分为各大行业下的小行业。预设行业可以为预先确定的某一行业,检索式可以理解为用户在搜索引擎中输入的查询条件,通常可以指输入的关键词,也可以包括检索语句。如鲜花行业对应的检索式可以包括:花店、鲜花、鲜花速递、鲜花购买和鲜花礼品等关键词,也可以为“常用的鲜花速递网有什么”等检索语句。120、根据所述预设行业的检索式信息通过搜索引擎进行检索,并从检索结果中抓取网页信息。130、从所述网页信息中确定目标网站。示例性的,通过搜索引擎对检索式信息进行分析,得到大量的网页信息,可以通过预设规则对网页信息进行筛选,确定目标网站。140、获取所述目标网站的候选网页集合,根据内容过滤技术对所述候选网页集合中的网页进行过滤及分析,获取目标客户的画像特征。示例性的,内容过滤技可以理解为根据网页内容对网页进行过滤的技术,如网页分类技术、网页实体分析技术和网页行业过滤等均属于内容过滤技术。客户的画像是指建立在一系列真实数据之上的目标客户模型,例如,以电商购物为例,电商们通过对消费者个体的消费能力、消费内容、消费品质、消费渠道、消费刺激的长时间多频次的建模,可以为每个客户构建一个精准的消费画像。本实施例中可以通过内容过滤技术筛选并分析所述候选网页集合中的网页,筛选出目标客户的对应网页,并根据目标客户的对应网页所包含的网页信息分析获取目标客户的画像特征。可选的,所述目标网页对应客户的画像特征可以包括:客户实体所属行业、客户主营产品和客户联系方式中的至少一种信息。搜索引擎索引的海量网页信息的突出特点是索引类别多、索引内容混乱,如常见的索引类别包括门户类、行业网站、交易网站、论坛和企业网站的索引等等,索引内容则存在网页模板多样化、编码不规范和网页广告冗余信息繁多等问题。如果对搜索引擎索引的海量网页信息一一解析来挖掘潜客户信息,则计算量非常大。本实施例提供的技术方案通过搜索引擎对预设行业的检索式信息进行检索,从检索结果中抓取网页信息并确定目标网站,对目标网站对应的网页集合进行进一步筛选和分析,得到目标客户的画像特征信息。通过对候选网页集合进行筛选和分析,从网页中提取出具有营销潜力的客户信息,实现从海量信息中精确锁定目标客户,提升客户量,并获取客户的画像特征信息,以保证后续营销的精准性。实施例二图2为本专利技术实施例二提供的一种客户信息挖掘方法的流程示意图,本实施例在上述实施例一的基础上,对确定预设行业的检索式信息进行优化,如图2所示,本实施例的方法包括:210、根据历史展现日志信息,筛选预设时间范围内所有进行过检索的检索式信息作为候选检索式集合。示例性的,历史展现日志信息可以理解为在搜索引擎中基于用户搜索行为的所有日志信息,根据距离当前时间一定时间范围内的展现日志信息本文档来自技高网...
一种客户信息挖掘方法、装置、设备以及存储介质

【技术保护点】
一种客户信息的挖掘方法,其特征在于,包括:确定预设行业的检索式信息;根据所述预设行业的检索式信息通过搜索引擎进行检索,并从检索结果中抓取网页信息;从所述网页信息中确定目标网站;获取所述目标网站的候选网页集合,根据内容过滤技术对所述候选网页集合中的网页进行过滤及分析,获取目标客户的画像特征。

【技术特征摘要】
1.一种客户信息的挖掘方法,其特征在于,包括:确定预设行业的检索式信息;根据所述预设行业的检索式信息通过搜索引擎进行检索,并从检索结果中抓取网页信息;从所述网页信息中确定目标网站;获取所述目标网站的候选网页集合,根据内容过滤技术对所述候选网页集合中的网页进行过滤及分析,获取目标客户的画像特征。2.根据权利要求1所述的方法,其特征在于,确定预设行业的检索式信息,包括:根据历史展现日志信息,筛选预设时间范围内所有进行过检索的检索式信息作为候选检索式集合;基于关键词推广系统中的行业与关键词的对应关系,通过短文本分类技术对所述候选检索式集合中的所有检索式信息进行分类,筛选出预设行业的检索式信息。3.根据权利要求1所述的方法,其特征在于,从所述网页信息中确定目标网站,包括:对所述网页信息进行解析,提取网页的标识信息,其中,所述标识信息包括标题信息、摘要信息和页面的地址信息中的至少一种;根据预设过滤规则对所述标识信息进行数据清洗,得到所述目标网站。4.根据权利要求1所述的方法,其特征在于,获取所述目标网站的候选网页集合,根据内容过滤技术对所述候选网页集合中的网页进行过滤及分析,获取目标客户的画像特征,包括:基于所述目标网站的地址信息访问所述目标网站,得到所述目标网站中的所有网页,作为候选网页集合;根据网页分类技术对所述候选网页集合所包含的网页进行过滤,得到所述目标网页;根据网页实体技术对所述目标网页进行分析,获取所述目标客户的画像特征。5.根据权利要求1-4任一项所述的方法,其特征在于,所述目标网页对应客户的画像特征包括:客户实体所属行业、客户主营产品和客户联系方式中的至少一种信息。6.一种客户信息的挖掘装置,其特征在于,包括:检索式确定模块,用于确定预设行业的检索式信息;检索模块,用于根据所述预设行业的检索式信息通过搜索引擎进行检索,并从检索结果中抓取网页信息;目标网...

【专利技术属性】
技术研发人员:齐海凤彭长平
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1