The embodiment of the invention provides a method and apparatus for searching personalized data based on the user, the method comprises: receiving search keyword input by a user; obtaining the semantic dictionary from preset search keywords associated data; the associated data and the users with the corresponding user groups; according to the user groups and the associated data for user feedback data. The embodiment of the application by using the semantic dictionary, solve the problem of difference between user input search and storage system of words, shortened from the data itself to produce value using data from massive data from the distance, fast search the needed data possible.
【技术实现步骤摘要】
一种基于用户的个性化数据搜索方法和装置
本申请实施例涉及数据处理
,特别是涉及一种基于用户的个性化数据搜索方法和一种基于用户的个性化数据搜索装置。
技术介绍
随着大数据时代的到来,企业收集到的数据越来越多,与此同时,要在海量数据中找到所需数据往往如大海捞针一般,费时费力。目前,大部分企业存储的数据表基本都是以英文名称、英文缩略词进行存储,而用户在搜索数据时,是根据自己的语言习惯,使用中文全称或英文全称进行搜索。用户在大数据平台上使用搜索关键词进行搜索时,最快得到搜索结果的方式是,按照数据表名称全匹配方式进行搜索,当然,所有用户在使用相同的搜索关键词时,搜索到数据的排序结果都是相同的。然而,在实际业务场景中,用户往往不知道大数据平台中,所想要数据表的具体名称,因此,只能使用自己所理解的中文来描述需求,由于大数据平台中的数据表通常是使用英文名称或者英文缩略词作为数据表名称,因此若使用中文进行搜索,很难在海量数据中精准找到所需数据。另一方面,使用同一个搜索关键词,对于业务不同的用户,所期望的搜索结果通常有所不同,如果大数据平台对所有用户给出一样的搜索结果,只会浪费 ...
【技术保护点】
一种基于用户的个性化数据搜索方法,其特征在于,包括:接收用户输入的搜索关键词;从预置的语义词典中获取所述搜索关键词的关联数据;所述关联数据和所述用户分别具有对应的用户群体;依据所述用户群体和所述关联数据为用户反馈数据。
【技术特征摘要】
1.一种基于用户的个性化数据搜索方法,其特征在于,包括:接收用户输入的搜索关键词;从预置的语义词典中获取所述搜索关键词的关联数据;所述关联数据和所述用户分别具有对应的用户群体;依据所述用户群体和所述关联数据为用户反馈数据。2.根据权利要求1所述的方法,其特征在于,所述语义词典通过如下方式生成:获取一个或多个用户群体的源数据文档;从所述源数据文档中提取出所述一个或多个用户群体对应的关联数据;按照用户群体将所述关联数据组织为的语义词典。3.根据权利要求1或2所述的方法,其特征在于,所述依据用户群体和所述关联数据为用户反馈数据的步骤包括:依据所述用户群体确定所述关联数据的权重数值;采用所述关联数据进行搜索得到搜索结果;按照所述权重数值将所述关联数据对应的搜索结果反馈给用户。4.根据权利要求3所述的方法,其特征在于,所述依据用户群体确定所述关联数据的权重数值的步骤包括:判断所述用户下的所述关联数据是否已记录有对应的权重数值;若是,则采用所述已记录的权重数值作为所述关联数据的权重数值;若否,则采用所述用户对应的用户群体和所述关联数据的用户群体确定所述关联数据的权重数值。5.根据权利要求4所述的方法,其特征在于,所述采用用户对应的用户群体和所述关联数据的用户群体确定所述关联数据的权重数值的步骤包括:分别判断所述关联数据的用户群体与所述用户对应的用户群体是否一致;若是,则为所述关联数据分配第一权重数值;若否,则为所述关联数据分配第二权重数值;其中,所述第一权重数值大于所述第二权重数值。6.根据权利要求3所述的方法,其特征在于,所述搜索结果具有对应的用户群体,所述搜索结果对应的关联数据具有对应的用户群体,在所述按照权重数值将所述关联数据对应的搜索结果反馈给用户的步骤之后,还包括:判断所述用户点击的搜索结果对应的用户群体是否与所述用户的用户群体一致;若否,则修改所述关联数据的权重数值。7.根据权利要求6所述的方法,其特征在于,所述修改所述关联数据的权重数值的步骤包括:将所述关联数据的第一权重数值修改为第三权重数值,以及将关联数据的第二权重数值修改为第四权重数值;其中,所述第三权重数值等于所述第四权重数值。8.根据权利要求1所述的方法,其特征在于,所述关联数据包括中文名称,英文名称,英文缩略词,中文缩略词,相似词,近义词,和/或同义词。9.一种基于用户的个性化数据搜索装置,其特征在于,包括:搜索关键词接收模块,用于接收用户输入的搜索关键词;关联数据获取模块,用于从预置的语义词典中获取所述搜索关键词的关联数据;所述关联数据和所述用户分别具有对应的用户群体;用户数据反馈模块,用于依据所述用户群体和所述关联数据为用户反馈数据。10.根据权利要求9所述的装置,其特征在于,所述装置还包括:源数据文档获取模块,用于获取一个或多个用户群体的源数据文档;关联数据提取模块,用于从所述源数据文档中提取出所述一个或多个用户群...
【专利技术属性】
技术研发人员:李晓菲,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。