识别对象发展阶段的方法和装置制造方法及图纸

技术编号:19779146 阅读:20 留言:0更新日期:2018-12-15 11:36
本申请提出一种识别对象发展阶段的方法和装置,其中,方法包括:获取经过训练的识别模型;其中,识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用目标对象的搜索序列进行训练生成的;搜索序列用于指示对应对象在多个时间点的搜索行为数据;获取待识别对象对应的搜索序列;采用识别模型,对待识别对象对应的搜索序列进行识别;根据识别得到的信息,确定待识别对象是否处于预设发展阶段。通过基于识别模型,识别待识别对象是否处于预设发展阶段,可以降低人工参与程度,提升了识别效率,以及提升对象识别的时效性。

【技术实现步骤摘要】
识别对象发展阶段的方法和装置
本申请涉及互联网
,尤其涉及一种识别对象发展阶段的方法和装置。
技术介绍
新兴行业,包括两种业务:突破性增长业务(即旧市场中的新产品,或者,旧市场的新模式)和战略性新业务开发(即创造新市场、新细分行业、甚至全新行业)。对于新兴行业,发现的越早,其投资风险越高,获得的收益越大,而发现的越迟,其投资风险越低,获得的收益越小。因此,预测新兴行业,并尽早进行布局,才是最有效的投资。现有技术中,预测新兴行业的方式主要有以下两种:第一种,针对各行业相关的应用程序(Application,简称APP),采集各种用户的使用指标,而后基于使用指标识别新兴行业;第二种,基于人工先验知识,识别新兴行业。第一种方式,识别的滞后性较高;第二种方式,由人工进行识别,识别的效率较低。
技术实现思路
本申请提出一种识别对象发展阶段的方法和装置,用于解决现有技术中识别的滞后性较高且效率较低的技术问题。本申请第一方面实施例提出了一种识别对象发展阶段的方法,包括:获取经过训练的识别模型;其中,所述识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用所述目标对象的搜索序列进行训练生成的;所述搜索序列用于指示对应对象在多个时间点的搜索行为数据;获取待识别对象对应的搜索序列;采用所述识别模型,对所述待识别对象对应的搜索序列进行识别;根据识别得到的信息,确定所述待识别对象是否处于所述预设发展阶段。本申请实施例的识别对象发展阶段的方法,通过获取经过训练的识别模型,其中,识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用目标对象的搜索序列进行训练生成的,搜索序列用于指示对应对象在多个时间点的搜索行为数据,而后获取待识别对象对应的搜索序列,接着采用识别模型,对待识别对象对应的搜索序列进行识别,最后根据识别得到的信息,确定待识别对象是否处于预设发展阶段。本申请中,基于识别模型,识别待识别对象是否处于预设发展阶段,可以降低人工参与程度,提升识别效率。此外,由于用户在遇到一个未知内容或者特定需求的时候,更倾向于通过搜索解决,而搜索中的具有长尾低频特性的搜索词代表用户的冷门需求,这种冷门需求往往是在一个新事物刚刚出现,还未在APP上市之前,以搜索词的形式出现,因此,采用目标对象的搜索序列对识别模型进行训练,采用训练后的识别模型识别待识别对象的发展阶段,在时间上可以早于基于APP中用户的使用指标进行识别的方式,从而可以提升对象识别的时效性。本申请第二方面实施例提出了一种识别对象发展阶段的装置,包括:第一获取模块,用于获取经过训练的识别模型;其中,所述识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用所述目标对象的搜索序列进行训练生成的;所述搜索序列用于指示对应对象在多个时间点的搜索行为数据;第二获取模块,用于获取待识别对象对应的搜索序列;第一识别模块,用于采用所述识别模型,对所述待识别对象对应的搜索序列进行识别;确定模块,用于根据识别得到的信息,确定所述待识别对象是否处于所述预设发展阶段。本申请实施例的识别对象发展阶段的装置,通过获取经过训练的识别模型,其中,识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用目标对象的搜索序列进行训练生成的,搜索序列用于指示对应对象在多个时间点的搜索行为数据,而后获取待识别对象对应的搜索序列,接着采用识别模型,对待识别对象对应的搜索序列进行识别,最后根据识别得到的信息,确定待识别对象是否处于预设发展阶段。本申请中,基于识别模型,识别待识别对象是否处于预设发展阶段,可以降低人工参与程度,提升识别效率。此外,由于用户在遇到一个未知内容或者特定需求的时候,更倾向于通过搜索解决,而搜索中的具有长尾低频特性的搜索词代表用户的冷门需求,这种冷门需求往往是在一个新事物刚刚出现,还未在APP上市之前,以搜索词的形式出现,因此,采用目标对象的搜索序列对识别模型进行训练,采用训练后的识别模型识别待识别对象的发展阶段,在时间上可以早于基于APP中用户的使用指标进行识别的方式,从而可以提升对象识别的时效性。本申请第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请第一方面实施例提出的识别对象发展阶段的方法。为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请第一方面实施例提出的识别对象发展阶段的方法。为了实现上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如本申请第一方面实施例提出的识别对象发展阶段的方法。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例一所提供的识别对象发展阶段的方法的流程示意图;图2为本申请实施例中“短租”在一年之内的PV趋势示意图;图3为本申请实施例中平滑处理后的“摩拜单车”的PVR曲线示意图;图4为本申请实施例二所提供的识别对象发展阶段的方法的流程示意图;图5a为本申请实施例中“火影忍者邪恶漫画花火”的PVR趋势示意图;图5b为本申请实施例中“石榴石”的PVR趋势示意图;图5c为本申请实施例中“小篆”的PVR趋势示意图;图5d为本申请实施例中“11选5最聪明的玩法”的PVR趋势示意图;图6为本申请实施例中迭代更新测试集的过程中识别模型的准确率变化曲线示意图;图7为本申请实施例三所提供的识别对象发展阶段的方法的流程示意图;图8为本申请实施例中“共享汽车”和各组人群的互信息大小示意图;图9为本申请实施例四所提供的识别对象发展阶段的装置的结构示意图;图10为本申请实施例五所提供的识别对象发展阶段的装置的结构示意图图11示出了适于用来实现本申请实施方式的示例性计算机设备的框图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。目前,预测和识别新兴行业,主要包括以下两种方式:第一种方式,针对各行业相关的APP,采集各种用户的使用指标,其中,使用指标例如可以为用户下载和使用APP的数据,包括日活跃用户数量(DailyActiveUser,简称DAU)、周活跃用户数量(WeeklyActiveUser,简称WAU)、月活跃用户数量(MonthlyActiveUser,简称MAU)、DAU/MAU、总使用时长、人均单日使用时长、使用次数、人均单日使用次数等。而后通过分析使用指标的变化、环比排名的变化率以及结合预测分析算法,确定新兴行业。第二种方式,基于先验知识进行人工综合判断,具体地,对行业覆盖的业务进行细筛,同时结合相关的行业分析报告、第三方分析数据,以及行业的经验等先验知识,确定新兴行业。第一种基于用户的使用指标进行识别的方式,识别的准确性较低,并且滞本文档来自技高网...

【技术保护点】
1.一种识别对象发展阶段的方法,其特征在于,所述方法包括以下步骤:获取经过训练的识别模型;其中,所述识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用所述目标对象的搜索序列进行训练生成的;所述搜索序列用于指示对应对象在多个时间点的搜索行为数据;获取待识别对象对应的搜索序列;采用所述识别模型,对所述待识别对象对应的搜索序列进行识别;根据识别得到的信息,确定所述待识别对象是否处于所述预设发展阶段。

【技术特征摘要】
1.一种识别对象发展阶段的方法,其特征在于,所述方法包括以下步骤:获取经过训练的识别模型;其中,所述识别模型是对处于预设发展阶段的目标对象,生成对应的搜索序列后,采用所述目标对象的搜索序列进行训练生成的;所述搜索序列用于指示对应对象在多个时间点的搜索行为数据;获取待识别对象对应的搜索序列;采用所述识别模型,对所述待识别对象对应的搜索序列进行识别;根据识别得到的信息,确定所述待识别对象是否处于所述预设发展阶段。2.根据权利要求1所述的识别对象发展阶段的方法,其特征在于,所述获取待识别对象对应的搜索序列,包括:获取用于搜索所述待识别对象的搜索词;根据对所述搜索词在各第一时长内的搜索行为数据,生成对应各第二时长内的搜索行为数据;其中,所述第二时长包含多个所述第一时长;将各第二时长内的搜索行为数据,作为所述搜索序列中对应时间点的搜索行为数据。3.根据权利要求1所述的识别对象发展阶段的方法,其特征在于,所述获取经过训练的识别模型之前,还包括:根据所述目标对象对应的搜索序列,生成训练集,并获取所述训练集中搜索序列的标注;所述标注用于指示搜索行为数据随时间变化趋势;根据处于各发展阶段的测试对象对应的搜索序列,生成测试集,并获取所述测试集中搜索序列的标注;采用所述训练集对所述识别模型进行训练;采用所述测试集,对经过训练的识别模型进行测试,得到测试集的预测标注;根据所述预测标注,与生成所述测试集时获取到的标注之间的差异,得到识别模型的性能参数。4.根据权利要求3所述的识别对象发展阶段的方法,其特征在于,所述预设发展阶段具体为发展初期,所述得到识别模型的性能参数之后,还包括:根据候选对象对应的搜索序列,生成候选集;其中,所述候选对象不同于所述目标对象和所述测试对象,所述候选对象的搜索行为数据随时间上升;采用经过训练的识别模型对所述候选集进行识别,得到所述候选对象对应搜索序列的预测标注和置信度;若所述候选对象对应搜索序列的预测标注指示搜索行为数据随时间上升,且所述置信度大于第一阈值,将所述候选对象对应的搜索序列增加到所述训练集中;返回执行采用所述训练集对所述识别模型进行训练,以及采用所述测试集,对经过训练的识别模型进行测试,得到性能参数的步骤,直至所述性能参数低于第二阈值。5.根据权利要求4所述的识别对象发展阶段的方法,其特征在于,所述获取经过训练的识别模型,包括:当所述性能参数低于所述第二阈值时,从历次循环执行采用所述训练集对所述识别模型进行训练后得到的性能参数中,选取最优性能参数;将具有所述最优性能参数的识别模型,作为所述经过训练的识别模型。6.根据权利要求4所述的识别对象发展阶段的方法,其特征在于,所述识别得到的信息包括所述待识别对象的预测标注以及置信度;所述根据识别得到的信息,确定...

【专利技术属性】
技术研发人员:陈冉
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1