The present invention provides a method and apparatus for the talent recommendation;, the method includes obtaining text data from the set database; the text data including at least one kind of articles, papers and web pages in the text; according to the text data published on text data for classification; hierarchical Dirichlet process on the way, each type of text data corresponding to the theme extraction processing; according to the results, the hot topic to obtain the current time; the text data corresponding to the author of the popular theme as talent recommendation. The invention can flexibly and accurately obtain each time the theme and popular themes of the day to avoid the redundant theme extracted large number of missing or theme setting theme caused problems, and improve the accuracy of recommendation according to the popular theme talent and flexibility.
【技术实现步骤摘要】
人才推荐方法和装置
本专利技术涉及数据检索
,尤其是涉及一种人才推荐方法和装置。
技术介绍
为了获取主题随着时间的演化规律,现有技术中通常通过如下三种方法:一是将时间信息结合到LDA模型,在LDA模型中引入时间因素,使得每个主题增添了一个时间属性,进而表达主题在不同时间的分布情况;二是首先使用LDA获取主题,再检索并量化主题在时间上的分布情况;三是先将文本离散到与之对应的时间窗上,再根据每个时间窗上的文本集合进行主题提取。上述三种方法均属于简单主题演化,采用上述方法进行主题演化时,易造成不同时间窗主题个数固定的问题,进而导致根据热门主题进行人才推荐的方式灵活度和准确度较低。针对上述人才推荐的方式灵活度和准确度较低的问题,尚未提出有效的解决方案。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种人才推荐方法和装置,以提高根据热门主题推荐人才的准确性和灵活性。第一方面,本专利技术实施例提供了一种人才推荐方法,包括:从预设的数据库中获取文本数据;其中,文本数据至少包括文章、论文和网页文本中的一种;根据文本数据的发布时间,对文本数据进行分类;采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理;根据处理结果,获取当前时间段的热门主题;将热门主题对应的文本数据的作者作为人才进行推荐。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,上述根据文本数据的发布时间,对文本数据进行分类的步骤,包括:提取文本数据的发布时间;将发布时间分别与预先设置的多个时间段进行匹配;根据匹配结果确定文本数据所属的时间段。结合第一方面的第一种可能 ...
【技术保护点】
一种人才推荐方法,其特征在于,包括:从预设的数据库中获取文本数据;其中,所述文本数据至少包括文章、论文和网页文本中的一种;根据所述文本数据的发布时间,对所述文本数据进行分类;采用分层狄利克雷过程的方式,对每个类型对应的所述文本数据进行主题提取处理;根据处理结果,获取当前时间段的热门主题;将所述热门主题对应的所述文本数据的作者作为人才进行推荐。
【技术特征摘要】
1.一种人才推荐方法,其特征在于,包括:从预设的数据库中获取文本数据;其中,所述文本数据至少包括文章、论文和网页文本中的一种;根据所述文本数据的发布时间,对所述文本数据进行分类;采用分层狄利克雷过程的方式,对每个类型对应的所述文本数据进行主题提取处理;根据处理结果,获取当前时间段的热门主题;将所述热门主题对应的所述文本数据的作者作为人才进行推荐。2.根据权利要求1所述的方法,其特征在于,所述根据所述文本数据的发布时间,对所述文本数据进行分类的步骤,包括:提取所述文本数据的发布时间;将所述发布时间分别与预先设置的多个时间段进行匹配;根据匹配结果确定所述文本数据所属的时间段。3.根据权利要求2所述的方法,其特征在于,所述采用分层狄利克雷过程的方式,对每个类型对应的所述文本数据进行主题提取处理的步骤,包括:逐一获取每个时间段对应的所述文本数据;采用分层狄利克雷过程的方式,对每个时间段对应的所述文本数据进行主题提取处理,生成每个时间段对应的主题。4.根据权利要求3所述的方法,其特征在于,所述根据处理结果,获取当前时间段对应的热门主题的步骤,包括:计算各个时间段内所述主题的出现频率,生成所述主题的演变规律;其中,所述演变规律为所述主题的出现频率与各个时间段的对应关系;根据所述主题的所述演变规律,确定当前时间段对应的热门主题。5.根据权利要求1所述的方法,其特征在于,所述将所述热门主题对应的所述文本数据的作者作为人才进行推荐的步骤,包括:获取所述热门主题对应的所述文本数据的作者;按照预设的排序条件,对所述作者进行排序;其中,预设的排序条件至少包括同一作者的所述文本数据的数量和所述文本数据的权重值中的一种;将排序结果满足预设阈值的所述作者作为人才进行推荐。6.一种人才推荐装置,其特征...
【专利技术属性】
技术研发人员:李微,王泽华,吴志成,张健,徐衔,郭晓茹,
申请(专利权)人:三螺旋大数据科技昆山有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。