【技术实现步骤摘要】
识别对象发展阶段的方法和装置
本申请涉及互联网
,尤其涉及一种识别对象发展阶段的方法和装置。
技术介绍
新兴行业,包括两种业务:突破性增长业务(即旧市场中的新产品,或者,旧市场的新模式)和战略性新业务开发(即创造新市场、新细分行业、甚至全新行业)。对于新兴行业,发现的越早,其投资风险越高,获得的收益越大,而发现的越迟,其投资风险越低,获得的收益越小。因此,预测新兴行业,并尽早进行布局,才是最有效的投资。现有技术中,预测新兴行业的方式主要有以下两种:第一种,针对各行业相关的应用程序(Application,简称APP),采集各种用户的使用指标,而后基于使用指标识别新兴行业;第二种,基于人工先验知识,识别新兴行业。第一种方式,识别的滞后性较高;第二种方式,由人工进行识别,识别的效率较低。
技术实现思路
本申请提出一种识别对象发展阶段的方法和装置,用于解决现有技术中识别的滞后性较高且效率较低的技术问题。本申请第一方面实施例提出了一种识别对象发展阶段的方法,包括:获取经过训练的识别模型;其中,所述识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用所述目标对象的搜索序列进行训练生成的;所述搜索序列用于指示对应对象在多个时间点的搜索行为数据;获取待识别对象对应的搜索序列;采用所述识别模型,对所述待识别对象对应的搜索序列进行识别;根据识别得到的信息,确定所述待识别对象是否处于所述预设发展阶段。本申请实施例的识别对象发展阶段的方法,通过获取经过训练的识别模型,其中,识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用目标对象的搜索序列进行训 ...
【技术保护点】
1.一种识别对象发展阶段的方法,其特征在于,所述方法包括以下步骤:获取经过训练的识别模型;其中,所述识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用所述目标对象的搜索序列进行训练生成的;所述搜索序列用于指示对应对象在多个时间点的搜索行为数据;获取待识别对象对应的搜索序列;采用所述识别模型,对所述待识别对象对应的搜索序列进行识别;根据识别得到的信息,确定所述待识别对象是否处于所述预设发展阶段。
【技术特征摘要】
1.一种识别对象发展阶段的方法,其特征在于,所述方法包括以下步骤:获取经过训练的识别模型;其中,所述识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用所述目标对象的搜索序列进行训练生成的;所述搜索序列用于指示对应对象在多个时间点的搜索行为数据;获取待识别对象对应的搜索序列;采用所述识别模型,对所述待识别对象对应的搜索序列进行识别;根据识别得到的信息,确定所述待识别对象是否处于所述预设发展阶段。2.根据权利要求1所述的识别对象发展阶段的方法,其特征在于,所述获取待识别对象对应的搜索序列,包括:获取用于搜索所述待识别对象的搜索词;根据对所述搜索词在各第一时长内的搜索行为数据,生成对应各第二时长内的搜索行为数据;其中,所述第二时长包含多个所述第一时长;将各第二时长内的搜索行为数据,作为所述搜索序列中对应时间点的搜索行为数据。3.根据权利要求1所述的识别对象发展阶段的方法,其特征在于,所述获取经过训练的识别模型之前,还包括:根据所述目标对象对应的搜索序列,生成训练集,并获取所述训练集中搜索序列的标注;所述标注用于指示搜索行为数据随时间变化趋势;根据处于各发展阶段的测试对象对应的搜索序列,生成测试集,并获取所述测试集中搜索序列的标注;采用所述训练集对所述识别模型进行训练;采用所述测试集,对经过训练的识别模型进行测试,得到测试集的预测标注;根据所述预测标注,与生成所述测试集时获取到的标注之间的差异,得到识别模型的性能参数。4.根据权利要求3所述的识别对象发展阶段的方法,其特征在于,所述预设发展阶段具体为发展初期,所述得到识别模型的性能参数之后,还包括:根据候选对象对应的搜索序列,生成候选集;其中,所述候选对象不同于所述目标对象和所述测试对象,所述候选对象的搜索行为数据随时间上升;采用经过训练的识别模型对所述候选集进行识别,得到所述候选对象对应搜索序列的预测标注和置信度;若所述候选对象对应搜索序列的预测标注指示搜索行为数据随时间上升,且所述置信度大于第一阈值,将所述候选对象对应的搜索序列增加到所述训练集中;返回执行采用所述训练集对所述识别模型进行训练,以及采用所述测试集,对经过训练的识别模型进行测试,得到性能参数的步骤,直至所述性能参数低于第二阈值。5.根据权利要求4所述的识别对象发展阶段的方法,其特征在于,所述获取经过训练的识别模型,包括:当所述性能参数低于所述第二阈值时,从历次循环执行采用所述训练集对所述识别模型进行训练后得到的性能参数中,选取最优性能参数;将具有所述最优性能参数的识别模型,作为所述经过训练的识别模型。6.根据权利要求4所述的识别对象发展阶段的方法,其特征在于,所述识别得到的信息包括所述待识别对象的预测标注以及置信度;所述根据识别得到的信息,确定...
【专利技术属性】
技术研发人员:陈冉,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。