当前位置: 首页 > 专利查询>刘莎专利>正文

一种语用关键词通用模板的生成、应用方法与装置制造方法及图纸

技术编号:8271436 阅读:146 留言:0更新日期:2013-01-31 03:39
本发明专利技术公开了一种语用关键词模版的生成、应用方法和装置,用于提高搜索信息的准确度。所述方法通过统计与任意语义关键词相关的语用关键词应用频率,生成一个可以适用于各类信息发布、检索的语用关键词通用模版,通过语义关键词和语用关键词的组合发布、检索,根本改善互联网信息的发布、检索效率。

【技术实现步骤摘要】
本专利技术涉及计算机及通信领域,特别是涉及生成、应用语用关键词模版的方法及>J-U ρ α装直。
技术介绍
目前,全文关键词搜索是互联网信息搜索的基本方法,但是,全文关键词实际上有两种完全不同的应用功能。例如,当用户在全文关键词检索输入栏中输入“NBA篮球比赛直播时间”时,一种需求是想检索到与“NBA篮球比赛直播时间”相关的所有信息,这时,“时间” 一词是揭示目标信息主题的语义关键词之一。另一种需求则是只想检索到NBA篮 球比赛直播的具体时间,如“ NBA篮球比赛直播9-30-20:30 ”,这时,“时间” 一词则是指示“9-30-20:30”功能与效用的语用关键词。显然,用户输入同一检索关键词的这两种不同应用功能需求,所指向的目标信息有巨大差别。因此,在关键词搜索中区别语义关键词和语用关键词,对提高关键词检索的精准度具有重要价值。问题在于,虽然语用关键词和语义关键词同是组织信息的基本要素,但如果没有语用关键字标签导航模版,信息发布方往往会忽略提供语用关键词,或者不知道应该提供什么语用关键词,或者发布方和检索方提供的语用关键词不一致。其结果是,关键词检索的非目标信息很可能在检索结果中排序在前,而目标信息排序在后。例如,按照关键字命中率排序,“NBA篮球比赛直播时间太晚”、“没时间看NBA比赛直播了 ”等信息会排序在前,而检索用户真正需要的目标信息“NBA篮球比赛直播9-30-20:30”则由于发布信息中没有“时间” 一词,只能排序在后。更为关键的问题是,即使发布用户提供了语用关键字,目前的全文关键字搜索服务实际上也无法判别,当搜索用户输入同一关键字时到底是要的其语义功能,还是语用功能?因此,目前的全文关键字检索实际上是一种不区分关键字语义功能和语用功能的模糊检索。也因此,无论加上多少辅助性技术手段,也无法根本改善全文关键字检索的效率。与此同时,为了提高信息搜索的效率,互联网上提供了上万种不同的结构化信息发布、检索模版(如购物、订票等结构化信息发布、检索模版),以引导用户在结构化标签下发布、检索信息。但是,各类结构化模版均不具有通用性,因此,在提高信息检索效率的同时,也大大增加了用户的使用难度。简言之,目前的关键词信息搜索方法仍然处在查精则不能查全,查全则不能查精的困境中。但是,经过我们的统计和研究,互联网信息中的语用关键词具有以下双十定律输入任意关键字,其相关信息的高频应用语用关键词在10X10范围以内。例如,输入任意搜索关键字(如NBA、国家发改委、智能手机、云计算、韩寒、欧美大片......),其相关信息的通用且常用分类包括新闻、告示、知识、论坛、产品、服务、人际交往、点播\下载、博客\微博、大黄页。而各类新闻的通用语用关键词包括标题、行为主体、行为、时间、地点、背景、综述......;各类人际交往(无论是征婚、交友、招聘、应聘......)的语用关键词均包括标题、交往目的、性别、年龄、职业.......依据上述双十定律,本专利技术提供一种语用关键词通用模版的生成、应用方法与装置,用于实现语义关键词和语用关键词的区别检索,以根本改善互联网信息发布、检索效率。
技术实现思路
一种语用关键词通用模版的生成、应用方法与装置,用于实现语义关键词和语用关键词的区别检索,以根本改善互联网信息发布、检索效率。一种语用关键词通用模版的生成方法,其主要流程步骤如下 采用随机抽样的方法获得任意关键词的检索结果;统计检索结果中的各类语用关键词的应用频率;调用高频语用关键词生成语用关键词通用模版;一种统计检索结果中的各类语用关键词的应用频率的方法,其特征在于,包括以下步骤统计结构化数据、半结构数据中的结构标签的应用频率;统计无结构信息中标点符号冒号与关键词形成的固定搭配的应用频率;统计语用关键词的嵌套关系及应用频率;统计不同发布主体分类下的语用关键词应用频率;统计不同语义关键词与语用关键词的关联应用频率;统计在语用关键词模版中由用户自由扩展的语用关键词使用频率。一种调用高频语用关键词生成语用关键词通用模版的方法,其步骤包括当没有获得用户选择的主体分类时,生成或调用不区分发布信息主体的、包括嵌套语用关键词的语用关键词通用模版;当获得用户选择的主体分类时,生成或调用区分发布信息主体的、包括嵌套语用关键词的语用关键词通用模版;当获得用户输入的语义关键词时,根据该语义关键词与语用关键词的关联应用频率,生成或调用不同语义关键词输入结果下的通用语用关键词模版;一种采用语用关键词模版发布信息的方法,其步骤包括从发布信息中获得语义关键词;生成或调用包括嵌套语用关键词语用关键词通用模版;获得用户点击的语用关键词;将该语用关键词添加语用关键词标示符后插入到任意文件中,或者,在该语用关键词对应的信息输入框中获得语义关键词;一种采用语用关键词模版检索信息的方法,其步骤包括调用检索语用关键词的通用模版;获得用户输入的检索用语义关键词和在语用关键词模版中选择的语用关键词;用用户输入的语义关键词和选择的语用关键词匹配发布信息中的语义关键词和语用关键词;调用并显示语义关键词和该语用关键词匹配成功的对应发布信息。—种语用关键词通用模版生成和应用装置,包括统计模块,用于统计语用关键词各类应用频率;存储模块,用于存储含有嵌套语用关键词的语用关键词通用模版及不同主体选择结果、不同关键词输入结果下的语用关键词通用模版;接口模块,用于用户调用通用语用关键词模版,并在语用关键词模版导航下发布、检索相关信息。本专利技术的目的是,通过统计任意关键词的语用关键词应用频率,生成一个可以适用于各类信息发布、检索的语用关键词通用模版,通过语义关键词和语用关键词的组合发布、检索,根本改善互联网信息的发布、检索效率。 附图说明图I为生成语用关键词通用模版的主要方法流程2为语用关键词通用模版示意3为不同信息主体语用关键词通用模版示意图;图4为嵌套语用关键词模版示意5A为不同语义关键词输入结果下的语用关键词模版示意图I图5B为不同语义关键词输入结果下的语用关键词模版示意图2图6为语用关键词及对应信息发布的主要方法流程7为为语义关键词结构化输入框示意8为在网页信息中添加语用关键词的操作结果示意9为可以由用户自由添加语用关键词的语用关键词发布模版示意10为语用关键词及对应信息检索的主要方法流程流程11为语义关键词与语用关键词组合检索模版示意12为检索结果显示界面示意13为相关装置结构示意图具体实施例方式本专利技术通过统计任意关键词的语用关键词应用频率,生成一个可以适用于各类信息发布、检索的语用关键词通用模版,通过语义关键词和语用关键词的组合发布、检索,根本改善互联网信息的发布、检索效率。本实施例中的“语义关键词”是指指示目标信息主题的关键词。并且,语义关键词可以是词、组合词、句子、文本段落。本实施例中的“语用关键词”是指指示语义关键词相关信息的功能与效用的关键词。本实施例中的“语用关键词”既包括结构化数据的结构标签,也包括非结构化信息中的固定搭配语用关键词,如,任意语用关键词和标点符号“”组合形成的固定搭配语用关键词“产品说明”。本实施例中的“语用关键词通用模版”,是指在全文关键词检索和结构化信息检索栏中随机输入任意关键词,获得检索结果链接网页,在网页信息中统计语用关键词使用频率,从统计结果中抽本文档来自技高网
...

【技术保护点】
一种语用关键词通用模版的生成、应用方法与装置,其特征在于,统计网页信息检索结果中的各类语用关键词的应用频率;调用高频语用关键词生成语用关键词通用模版;采用语用关键词通用模版发布信息;采用语用关键词通用模版检索信息;

【技术特征摘要】
1.一种语用关键词通用模版的生成、应用方法与装置,其特征在于, 统计网页信息检索结果中的各类语用关键词的应用频率; 调用高频语用关键词生成语用关键词通用模版; 采用语用关键词通用模版发布信息; 采用语用关键词通用模版检索信息;2.如权利要求I所述的统计检索结果中的各类语用关键词的应用频率的 方法,其特征在于,包括以下步骤 统计结构化数据、半结构数据中的结构标签的应用频率; 统计无结构信息中标点符号冒号与关键词形成的固定搭配的应用频率; 统计语用关键词的嵌套关系及应用频率; 统计不同发布主体分类下的语用关键词应用频率; 统计不同语义关键词与语用关键词的关联应用频率; 统计在语用关键词模版中由用户自由扩展的语用关键词使用频率。3.如权利要求I所述的调用高频语用关键词生成语用关键词通用模版的方法,其特征在于,包括以下步骤 当没有获得用户选择的主体分类时,生成或调用不区分发布信息主体的、包括嵌套语用关键词的语用关键词通用模版; 当获得用户选择的主体分类时,生成或调用区分发布信息主体的、包括嵌套语用关键词的语用关键词通用模版; 当获得语义关键词时,根据该语义关键词与语用关键词的关联应用频率,生成或调用不同语义关键词输入结果下的通用语用关键词模版;4.如权利要求I所述的一种采用语用关键词通用模版发布信息的方法, 其特征在于,包括以下步骤 从发布信息中获得语义关键词; 调用语用关键词通用模版; 获得用户点击的语用关键词; 将该语用关键词加上语用关键词标示符添加到任意文件中,或者, 在该语用关键词对应的信息输入框中获得...

【专利技术属性】
技术研发人员:刘莎
申请(专利权)人:刘莎
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1