网站中的信息发布方法和系统技术方案

技术编号:8300818 阅读:129 留言:0更新日期:2013-02-07 04:16
本发明专利技术提供了一种网站中的信息发布方法和系统,其中,该方法包括:信息发布端的服务器通过客户端接收用户输入的待发布信息的主题信息;服务器向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;服务器将所查询到的查询条目作为待发布信息的关键词发送给客户端;服务器通过客户端接收对关键词进行选择得到的发布信息。本发明专利技术解决在不额外占用网站数据库的存储空间的情况下如何进一步提高检索的召回率的技术问题,从而能够在不额外占用网站数据库服务器存储空间的情况下提高用户发布信息的召回率。

【技术实现步骤摘要】

本申请涉及互联网
,具体而言,涉及一种网站中的信息发布方法和系统
技术介绍
信息检索的基本过程是1)用户构思一个表达其搜索意图的查询词并提交搜索引擎;2)搜索引擎检索出与该关键词匹配的网页;3)搜索引擎对检索到的网页根据网页本身的信息或网页之间的关系按照某种既定策略进行排序。垂直搜索引擎,如电子商务搜索引擎,与通用搜索引擎的区别之一在于电子商务搜索引擎更看重匹配结果的精确性,要求完全匹配用户的输入。例如用户查询时常常输入特定属性、型号或品牌的产品,电子商务搜索引擎通常的做法是保证查询词的各个部分(规范化处理除外)都要在查询结果中被检索到。这种做法很大程度上保证了检索结果的精确性,但召回率(检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率)相应的会有一定的损失,原因是用户的产品发布信息(offer)中没有包含某些特定的属性、型号或品牌等关键词描述,从而最终导致查询用户的查询体验度下降。提高检索召回率的方法之一可以是在网站的用户发布信息的时候,要求用户填写更完善的信息描述,如将商品的特定属性、型号或品牌等关键词一一填写完整,并上传至网站服务器,存储在网站数据库中。这样在信息的检索过程中,就能有更多的查询结果与查询用户输入的查询关键词相匹配。然而这种做法遇到的最大的技术问题是,由于用户发布信息时填写的信息内容的增多,导致用户发布信息中的数据量会增大,对于一个超大型的网站,其数据库存储容量将会受到挑战,导致该网站必须增加更多的数据库服务器来存储用户发布信息时额外填写的数据信息。针对相关技术中上述存在的问题,目前尚未提出在不额外占用网站数据库的存储空间的情况下,如何进一步提高检索的召回率的技术方案。
技术实现思路
本申请的主要目的在于提供一种网站中的信息发布方法和系统,以至少解决现有技术中在不额外占用网站数据库的存储空间的情况下,如何进一步提高检索的召回率的技术问题。根据本申请的一个方面,提供了一种网站中的信息发布方法,包括信息发布端的服务器通过客户端接收用户输入的待发布信息的主题信息;服务器向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;服务器将所查询到的查询条目作为待发布信息的关键词发送给客户端;服务器通过客户端接收对关键词进行选择得到的发布信息。进一步地,主题信息包括待发布信息的标题以及类别。进一步地,服务器通过以下查询步骤向存储器查询与主题信息相关的查询条目服务器将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M > N ;服务器从存储器中查询是否存在包括N个关键词的查询条目;若存在,则服务器判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于等于,则将属于类别的前P个所查询到的查询条目作为与主题信息相关的查询条目,其中,P为预先设定的自然数。进一步地,若服务器判断所查询到的查询条目中属于所述类别的查询条目的个数小于P个,则服务器向存储器查询与主题信息相关的查询条目的步骤还包括重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个服务器令N = N-I,并在存储器中执行查询步骤。进一步地,服务器通过以下查询步骤向存储器查询与主题信息相关的查询条目服务器从存储器中选择出属于类别的查询条目;服务器将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M > N ;服务器在选择出来的属于类别的查询条目中查找是否存在Q个以上包括N个关键词的查询条目,其中,Q为预 先设定的自然数;若存在,则将属于类别的前Q个所查询到的查询条目作为与主题信息相关的查询条目。进一步地,若服务器判断出属于类别的所查询到的查询条目的个数小于Q个,则服务器向存储器查询与主题信息相关的查询条目的步骤还包括重复执行以下步骤,直到属于类别的所查询到的查询条目的个数大于等于Q个服务器令N = N-1,并在存储器中执行查询步骤。进一步地,服务器将所查询到的查询条目作为关键词发送给客户端的步骤包括服务器根据查询到的查询条目中的每一个查询条目的线上查询结果的个数是否大于预定阈值;服务器将线上查询结果的个数大于预定阈值的查询条目记录为第一组查询条目,并将线上查询结果的个数小于等于预定阈值的查询条目记录为第二组查询条目;服务器将第一组查询条目和第二组查询条目作为关键词发送给客户端。进一步地,服务器将线上查询结果的个数大于预定阈值的查询条目记录为第一组查询条目的步骤包括计算线上查询结果的个数大于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第一组查询条目中记录查询结果的个数大于预定阈值的查询条目。服务器将线上查询结果的个数小于等于预定阈值的查询条目记录为第二组查询条目的步骤包括计算线上查询结果的个数小于等于预定阈值的查询条目中的每一个查询条目与标题的相关度;按照相关度从大到小的顺序在第二组查询条目中记录查询结果的个数小于等于预定阈值的查询条目。进一步,在服务器向存储器查询与主题信息相关的查询条目之前,上述方法还包括服务器对存储器中存储的历史记录的查询条目进行更新。根据本申请的另一方面,提供了一种网站中的信息发布系统,包括信息发布端的服务器和客户端,其中,客户端用于向服务器发送用户输入的待发布信息的主题信息,其中,主题信息包括待发布信息的标题以及类别;信息发布端的服务器用于接收客户端发送的主题信息;向存储器查询与主题信息相关的查询条目,其中,存储器存储有历史记录的查询条目;将所查询到的查询条目作为待发布信息的关键词发送给客户端,并通过客户端接收对关键词进行选择得到的发布信息。进一步地,服务器包括第一标题处理单元,用于在向存储器查询与主题信息相关的查询条目时,将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M > N ;第一查询单元,用于从存储器中查询是否存在包括N个关键词的查询条目;第一判断单元,用于在存在包括N个关键词的查询条目时,判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于等于,则将属于类别的前P个所查询到的查询条目作为与主题信息相关的查询条目,其中,P为预先设定的自然数。进一步地,服务器还用于在第一判断单元判断出所查询到的查询条目中属于所述类别的查询条目的个数小于P个时,重复执行以下步骤,直到所查询到的查询条目中属于所述类别的查询条目的个数大于等于P个服务器令N = N-I ;通知第一标题处理单元从M个关键词中选取N个关键词;通知第一查询单元从存储器中查询是否存在包括N个关键词的查询条目;以及通知第一判断单元在存在包括N个关键词的查询条目时判断所查询到的查询条目中属于所述类别的查询条目的个数是否大于等于P个,若大于,则将属于类别的前P个所查询到的查询条目作为与主题信息相关的查询条目。 进一步地,服务器包括选择单元,用于从存储器中选择出属于类别的查询条目;第二标题处理单元,用于将标题分割成M个独立的关键词,并从M个关键词中选取N个关键词,其中,M和N均为自然数,且M SN;第二查询单元,用于在选择出来的属于类别的查询条目中查找是否存在Q个本文档来自技高网
...

【技术保护点】
一种网站中的信息发布方法,其特征在于,包括:信息发布端的服务器通过客户端接收用户输入的待发布信息的主题信息;所述服务器向存储器查询与所述主题信息相关的查询条目,其中,所述存储器存储有历史记录的查询条目;所述服务器将所查询到的查询条目作为所述待发布信息的关键词发送给所述客户端;所述服务器通过所述客户端接收对所述关键词进行选择得到的发布信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:张祝玉黄鹏林锋冯炯
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1