一种发布、搜索信息的方法及装置制造方法及图纸

技术编号:3950139 阅读:186 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种发布、搜索信息的方法,用于提高搜索信息的准确度。所述发布信息方法包括:进行信息发布并获得所发布的信息;获得发布信息对应的发布关键词;确定所述发布关键词的上位词。所述搜索信息方法包括:获得用户输入的搜索关键词;将所述搜索关键词与发布信息对应的发布关键词和发布关键词的上位词进行匹配;提取匹配成功的发布关键词和上位词对应的发布信息。本发明专利技术还公开了用于实现所述方法的装置。

【技术实现步骤摘要】

本专利技术涉及计算机及通信领域,特别是涉及发布、搜索信息的方法及装置
技术介绍
随着计算机及网络技术,通过网络搜索信息已成为人们获得信息的主要方式之 一。作为主要搜索工具的搜索引擎,是指根据一定的策略、运用特定的计算机程序搜集互联 网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检 索服务的系统。搜索引擎主要有全文搜索引擎、目录搜索引擎、元搜索引擎和垂直搜索引擎寸。全文搜索引擎需要有庞大数据库的支持,优点是搜全率比较高,但是对硬件资源 要求比较高,并且搜索精准度有待提高。为此提出了目录索引,其顾名思义就是将网站分门 别类地存放在相应的目录中,因此用户在查询信息时,可选择在分类目录下关键词搜索。如 以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中 人为因素要多一些。目录下的关键字搜索的优点是准确率比较高。而元数据搜索和垂直搜 索的信息查全性能都相对较低。但无论是全文搜索还是分类目录下的关键字搜索,或者元数据搜索和垂直搜索, 均只是将用户输入的关键词与目标信息进行匹配,如果目标信息不包含该关键词,则搜索 不到该信息。例如,用户输入的关键词是“XXX球队NBA篮球比赛时间”,目标信息的标题是 “9月30日XXX球队NBA篮球比赛20:30(晚间8点半),,,由于其未包含“时间”一词,则很 可能无法搜索到该目标信息,或者在搜索结果中将该目标信息排在“NBA篮球比赛直播太 晚了”或“没看NBA篮球比赛直播”之后,但“9月30日”很可能就是用户想要知道的信息。 可见,现有技术搜索信息的准确度还有提高。
技术实现思路
本专利技术实施例提供一种发布、搜索信息的方法及装置,用于提高搜索信息的准确度。一种发布信息的方法,用于改进发布过程,以便更准确的搜索信息,其包括以下步 骤进行信息发布并获得所发布的信息;获得发布信息对应的发布关键词;确定所述发布关键词的上位词。一种搜索信息的方法,包括以下步骤获得用户输入的搜索关键词;将所述搜索关键词与发布信息对应的发布关键词和发布关键词的上位词进行匹 配;提取匹配成功的发布关键词和上位词对应的发布信息5一种用于发布信息的装置,包括发布模块,用于进行信息发布并获得所发布的信息;关键词模块,用于获得发布信息对应的发布关键词;上位模块,用于确定所述发布关键词的上位词。一种用于搜索信息的装置,包括接口模块,用于获得用户输入的搜索关键词;匹配模块,用于将所述搜索关键词与发布信息对应的发布关键词和发布关键词的 上位词进行匹配;搜索模块,用于提取匹配成功的发布关键词和上位词对应的发布信息。本专利技术实施例中在发布信息时为发布信息的发布关键词确定相应的上位词,在搜 索时不仅将搜索关键词与发布信息的发布关键词匹配,还将搜索关键词与发布关键词的上 位词匹配,以解决没有匹配成功的发布关键词或发布信息导致搜索到的信息不够准确以及 搜索到较多的无关信息等问题。附图说明图IA为本专利技术实施例中上位词的示意图;图IB为本专利技术实施例中发布信息的主要方法流程图;图2为本专利技术实施例中自动确定上位词时发布信息的方法流程图;图3A和图3B为本专利技术实施例中提供的上位词的示意图;图3C为本专利技术实施例中提供的备选上位词的示意图;图4为本专利技术实施例中通过内容结构发布信息的方法流程图;图5为本专利技术实施例中内容结构的示意图;图6为本专利技术实施例中搜索信息的主要方法流程图;图7为本专利技术实施例中确定上位词时搜索信息的方法流程图;图8为本专利技术实施例中提供备选上位词时搜索信息的方法流程图;图9A为本专利技术实施例中通过内容结构搜索信息的方法流程图;图9B为本专利技术实施例中内容结构与关键词输入框结合的示意图;图10为本专利技术实施例中发布装置的结构图;图11为本专利技术实施例中搜索装置的主要结构图;图12为本专利技术实施例中搜索装置的详细结构图。具体实施例方式本专利技术实施例中在发布信息时为发布信息的发布关键词确定相应的上位词,在搜 索时不仅将搜索关键词与发布信息及发布关键词匹配,还将搜索关键词与发布关键词的上 位词匹配,以解决没有匹配成功的发布关键词或发布信息导致的搜索到的信息不够准确以 及搜索到较多的无关信息等问题。本实施例中发布关键词和搜索关键词都可以是一个或多个词,也可以是一句话或一个标题、一段文字等。本实施例中的关键字对应的上位词可以是关键字语义归类后树状结构中的任何6上一层中的词。例如,扳手、钳子可以归类为手工工具,而手工工具可以归类为工具,并且上 位词可以具有如图IA的结构化特征。参见图1B,本实施例中发布信息的主要方法流程如下步骤101 进行信息发布并获得所发布的信息。步骤102 获得发布信息对应的发布关键词。具体的,可以通过用户的输入操作获 得发布信息对应的发布关键词。或者,对发布信息进行分词,通过分词后得到的词获得发布 信息对应的发布关键词。步骤103 确定所述发布关键词的上位词。由于步骤102和103有多种具体实现方式,下面通过两个典型实施例来详细介绍。参见图2,本实施例中确定上位词时发布信息的方法流程如下步骤201 进行信息发布并获得所发布的信息。步骤202 对发布信息进行分词,通过分词后得到的词获得发布信息对应的发布 关键词。较佳的,此步骤中对发布信息进行分词,滤除无关词,如“的”、“我”等代词、助词和 连词。将剩余的实意词(如名称、动词等)作为发布关键词。步骤203 对分词后的每个发布关键词,通过预设的词与上位词的对应关系,分别 确定对应的上位词。例如,年、月、日、分、秒等日期时间类的词的上位词是时间;省、市、街、 馆、中心等词的上位词是地点;衬衣、裤子等词的上位词是服装。此处不一一列举,词与上位 词的对应关系可由数据库实现。例如图3A所示,左侧是发布信息,右侧第一列为与发布信 息标题(也是发布关键词)对应的上位词。或者例如图3B,将上位词加入索引表,在每个发 布关键词后面增加相应的上位词,如括号中的词。例如,发布的信息是NBA篮球比赛的视频,发布关键词(或标题)是9月30日XXX 球队NBA篮球比赛的视频,系统对关键词进行分词和识别后发现有月和日,则生成或自动 调用上位词“时间”,识别出篮球比赛中的“比赛”,可生成或自动调用上位词“行为”。在步骤203中,也可以向用户输出上位词输入框,由用户输入上位词。或者较佳 的,向用户输入备选上位词,该备选上位词可由系统提供,或者,对关键词进行分词和识别 后提供,也可以根据用户自由输入的上位词获得上位词,参见图3C所示,通过用户对备选 上位词的选择操作(如点击操作),确定所述发布关键词的上位词。参见图4,本实施例中通过内容结构发布信息的方法流程如下步骤401 进行信息发布并获得所发布的信息。步骤402 通过内容结构获得用户输入的发布信息对应的发布关键词。步骤403 将所述发布关键词对应的结构标签确定为所述发布关键词的上位词。内容结构如图5所示,一个分类项和一个结构项可定位到一个结构单元,分类项 和结构项的标示词即为结构标签,结构标签下的“ 0 ”用于用户输入关键词。发布信息的目的就是希望该信息能够被搜索到,下面对信息搜索过程进行介绍。参见图6,本实施例中搜索信息的主要方法流程如下步骤601 获得用户输入的搜索关键词。步骤602 将所述搜索本文档来自技高网
...

【技术保护点】
一种发布信息的方法,其特征在于,包括以下步骤:进行信息发布并获得所发布的信息;获得发布信息对应的发布关键词;确定所述发布关键词的上位词。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘莎
申请(专利权)人:北京思在信息技术有限责任公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1