【技术实现步骤摘要】
数据搜索方法、装置、介质及产品
[0001]本专利技术涉及通信技术,尤其涉及一种数据搜索方法、装置、介质及产品。
技术介绍
[0002]如今,社交媒体是人们彼此之间用来分享意见、见解、经验、观点的工具和平台,如何基于社交媒体中大量信息快速筛选得到相关联的信息的是一个重要的研究方向。
[0003]当前技术中,其中一种针对社交媒体中的用户信息的筛选方法为:对目标区域的用户账户信息均进行采集,然后再通过设置的筛选条件对用户做筛选,从而基于筛选得到关联的目标账户。
[0004]由于使用当前技术中的这种实现方式,所有用户账号之间无明显的采集先后顺序,会导致采集到有效账号的速度相对会很慢,无效数据多,资源消耗大。
技术实现思路
[0005]本专利技术提供一种数据搜索方法、装置、介质及产品,用以解决采集到有效账号的速度慢,无效数据多,资源消耗大的问题。
[0006]第一方面,本专利技术提供一种数据搜索方法,包括:
[0007]确定满足搜索要求的种子账户;
[0008]确定所述种子账户 ...
【技术保护点】
【技术特征摘要】
1.一种数据搜索方法,其特征在于,包括:确定满足搜索要求的种子账户;确定所述种子账户的至少一个关联账户并计算各关联账户的关联总分;将所述关联账户按照关联总分由高到低进行排序,并按照所述排序顺序依次确定每个关联账户的子关联账户,以按照排序顺序优先获取到与所述种子账户最具关联性的目标账户。2.根据权利要求1所述的方法,其特征在于,所述确定满足搜索要求的种子账户,包括:获取位于预定义的目标区域内的账户;将所述位于预定义的目标区域内的账户确定为种子账户。3.根据权利要求1所述的方法,其特征在于,所述确定满足搜索要求的种子账户,包括:获取预定义的目标区域或预定义的目标事件对应的至少一个群组作为种子群组,并将种子群组内的群成员账户确定为种子账户;或者获取参加目标事件话题的用户账户,并将参加目标事件话题的用户账户确定为种子账户。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取种子账户和关联账户的位置信息;根据种子账户的位置信息剔除不在预定义的目标区域内的种子账户,并根据关联账户的位置信息剔除不在预定义的目标区域内的关联账户。5.根据权利要求1所述的方法,其特征在于,所述确定所述种子账户的至少一个关联账户,包括:获取所述种子账户对应的应用使用相关信息;根据所述应用使用相关信息确定至少一个关联账户;所述应用使用相关信息包括以下信息的任意一种或多种:账户关系信息,行为信息,所属群组信息。6.根据权利要求5所述的方法,其特征在于,所述根据所述应用使用相关信息确定至少一个关联账户,包括:根据应用使用相关信息筛选出属于满足关联要求的用户账户;将满足关联要求的用户账户确定为关联账户。7.根据权利要求5所述的方法,其特征在于,所述计算各关联账户的关联总分,包括:根据各关联账户的语种信息和位置信息计算各关联账户的第一得分;根据各关联账户对应的种子账户的应用使用信息计算各关联账户的第二得分;根据各关联账户是否为预设影响力的账户,确定各关联账户的第三得分;将各关联账户的第一得分,第二得分及第三得分进行求和运算,以获得对应的关联总分。8.根据权利要求7所述的方法,其特征在于,所述根据各关联账户的语种信息和位置信息计算各关联账户的第一得分,包括:确定各关联账户对应的个人信息中的位置信息,动态信息中的位置信息,动态信息中是否包含目标区域地点名称,预定义的目标区域匹配的语种信息,关联账户的语种信息;若确定某关联账户满足第一预设条件,则确定该关联账户的第一子得分为基于满足第
一预设条件的关联账户的数量与所有关联账户的数量的比值得到的,否则确定该关联账户的第一子得分值为零;所述第一预设条件为:所述关联账户对应的个人信息中的位置信息中的位置位于预定义的目标区域;若确定某关联账户满足第二预设条件,则确定该关联账户的第二子得分为基于满足第二预设条件的关联账户的数量与所有关联账户的数量的比值得到的,否则确定该关联账户的第二子得分值为零;所述第二预设条件为:所述关联账户对应的动态信息中的位置信息中的位置位于预定义的目标区域;若确定某关联账户满足第三预设条件,则确定该关联账户的第三子得分为基于满足第三预设条件的关联账户的数量与所有关联账户的数量的比值得到的,否则确定该关联账户的第三子得分值为零;所述第三预设条件为:预定义的目标区域匹配的语种为唯一语种,且所述关联账户的语种信息中的语种与所述目标区域的语种相同;若确定某关联账户满足第四预设条件,则确定该关联账户的第四子...
【专利技术属性】
技术研发人员:杨飞,曹六一,张丹,
申请(专利权)人:北京北大方正电子有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。