【技术实现步骤摘要】
内容推荐方法本申请是申请号为2013100761474、申请日为2013年03月11日、专利技术创造名称为“内容推荐系统”的专利的分案申请。
本专利技术涉及文字信息检索技术,尤其涉及一种内容推荐方法。
技术介绍
信息技术的不断发展极大提高了人们获取信息的便利性。无论是通过互联网的各大门户网站、电子商务系统还是通过企业内部的各种资源共享系统的方式,海量的信息开放给用户自由查阅。目前信息量的日益庞大,很大程度上增加了用户获取有效信息的繁重性和复杂度。如何根据用户在网络上查阅文件的行为,分析用户阅读兴趣并检索有效信息提供给用户是信息检索中一个重要的课题。
技术实现思路
鉴于以上内容,有必要提供一种内容推荐系统及方法,可以有效利用用户网络上的检索行为,统计并分析用户阅读兴趣,获取有效的文件信息提供给用户。所述的内容推荐系统包括:断词模块,用于对资料库中的文件进行断词;提取模块,用于过滤断词结果,并计算过滤结果中词的重要程度,以重要程度为依据,提取出文件的关键词;统计模块,用于统计用户查阅的历史记录内文件的关键词及重要程度,并计算出关键词的适合度,以适合度为依据,筛选出用户的兴 ...
【技术保护点】
一种内容推荐方法,其特征在于,该方法包括:断词步骤:对资料库的文件断词;提取步骤:过滤断词结果,并计算过滤结果中词的重要程度,并以重要程度为依据提取文件的关键词;统计步骤:统计用户查阅的历史记录内文件的关键词及重要程度,并计算出关键词的适合度,以适合度为依据筛选用户的兴趣关键词;及检索步骤:根据用户的兴趣关键词进行检索,并以兴趣关键词在文件中的比重来计算文件的关注度,以关注度为依据选取文件返回给用户。
【技术特征摘要】
1.一种内容推荐方法,其特征在于,该方法包括:断词步骤:对资料库的文件断词;提取步骤:过滤断词结果,并计算过滤结果中词的重要程度,并以重要程度为依据提取文件的关键词;统计步骤:统计用户查阅的历史记录内文件的关键词及重要程度,并计算出关键词的适合度,以适合度为依据筛选用户的兴趣关键词;及检索步骤:根据用户的兴趣关键词进行检索,并以兴趣关键词在文件中的比重来计算文件的关注度,以关注度为依据选取文件返回给用户。2.如权利要求1所述的内容推荐方法,其特征在于,在断词步骤前还包括:解析步骤,将资料库中的文件解析为具有标题及文字正文的结构性的文字信息以便断词。3.如权利要求1所述的内容推荐方法,其特征在于,所述断词步骤在对中文文字信息断词时采用混合式断词法,即先用规则式词库断词法对文字信息进行第一阶段的断词,再用统计式断词法对第一阶段断词后的断词结果进行频率统计,列出所有可能的词。4.如权利要求1所述的内容推荐方法,其特征在于,所述提取步骤包括:根据常用词词库对断词结果进行过滤;利用加权法计算过滤后的词的重要程度,计算公式为:词的重要程度=该词在文字正文出现的次数×正文权重+该词在标题中出现次数×标题权重;根据每个词的重要程度进行降序排列,取...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。