当前位置: 首页 > 专利查询>张占平专利>正文

一种基于众多用户人工参与而生成折射词的方法技术

技术编号:8453083 阅读:228 留言:0更新日期:2013-03-21 17:31
一种基于众多用户人工参与而生成折射词的方法。本发明专利技术的技术概要是:众多用户分别通过网络人工提交2-N个具有某种关联的提交词,从而构成一个提交串,服务器利用众多的提交串一步一步最终自动生成折射词。搜索引擎、手机来电或者输入法均可调用和显示本发明专利技术的折射词,以便帮助更多的用户扩大思路。摘要附图所示的是一种在输入法操作窗口自动调用和显示折射词的实施例。搜索引擎或者手机来电调用折射词也同样是本发明专利技术的实施例。另外,在浏览器的地址栏窗口、即时聊天窗口(如QQ)、电子邮件窗口或者游戏窗口等等也可以调用折射词,也是本发明专利技术的实施例。

【技术实现步骤摘要】

本专利技术要求保护的技术方案所属的
是公众提交数据、服务器融合数据、检索数据和显示数据。
技术介绍
本申请人于2010年08月04日曾经申请过两项专利“一种从众多网络搜索词里生成折射词的方法”和“一种从众多网络标签里生成折射词的方法”;申请号分别是201010244300. 6 和 201010244308. 2。本申请人于2012年03月16日申请过与本申请具备相同主题的申请(申请号为201210080523. 2)。为了避免在专利公报上公开201210080523. 2申请的内容,201210080523. 2申请没有缴纳申请费。201210080523. 2申请虽然没有在专利公报上公开,但是,在国家知识产权局里有存档。所以,本专利技术以201210080523. 2申请作为优先权的依据。本专利技术的技术概要是公众通过网络人工提交具有某种关联的提交词,服务器利用众多的提交词生成折射词;输入法或者搜索引擎等窗口可以调用这些折射词。关于“某种关联”的理解“关联”具备个性化,取决于提交者的经历、素质和当前的思维。每个用户每次提交的各个提交词之间的最基本的关联是这些提交词是由同一个用户提交的或者是由有关联的多个用户一起协商之后提交的。目前,网友在baidu、google、bing或者yahoo等搜索引擎的搜索框里输入字符串,会在搜索框的下方显示一些提示词供网友选择。这些提示词的特征是包含网友刚刚输入的字符串的全部字符串或者部分字符串。 在baidu、google、bing或者yahoo等引擎的搜索结果页面的下方会显示一些搜索建议词,这些搜索建议词的特征是包含网友的搜索词或者包含网友搜索词被拆分出来的o比如在www. google, com. hk里搜索中文文字“圣诞节”,那么,在搜索结果页面里会出现复活节、万圣节、Christmas和圣诞节图片。这是因为搜索引擎把“圣诞节”拆分为“圣诞”和“节”两个词之后,在数据库里(分别)匹配包含这两个拆分词的词。另外,引擎会匹配翻译后的外文(christmas)。在www. baidu. com里搜索“圣诞节”时,在搜索结果页面里会出现圣诞结。这是依据中文汉语拼音的同音匹配原则。同理,在WWW. baidu. com的搜索框里搜索“shengdanjie”,会提示“圣诞节”这个提示词。这也是依据中文汉语拼音的匹配结果。一些搜索引擎具备记忆功能依据包含当前输入的字符串的原理,把某个用户之前使用过的(包含当前输入的字符串的)搜索词优先提示给该用户;或者,依据包含当前输入的字符串的原理,把某个用户之前使用过的一个、两个或者多个搜索词组合成为(包含当前输入的字符串的)一个字符数量更多的提示词提示给用户。这仍然是依据包含当前输入的字符串的匹配原理。另外,当前一些搜索引擎或者其它类型的网站,会依据热点人物或者热点事件列出一个或者多个热门词,其特征在于“热”。下面的一个例子,可以说明目前的搜索引擎的不足之处,同时,也说明了本专利技术与现有技术相比较所具有的新的技术效果。举例—个网友拥有一个手机号码和5个电子邮箱13801050000zhil63. comzhagnz@sina.comzhaigmail. comzhagnzilive. comzhagnzhajsihotmaiI. com这些邮箱和电话号码都不是公众熟知的“热词”,相互之间也不是近义词。这个网友(或者与这个网友相关的网友)把这6个独立的信息作为6个提交词一起提交给服务器,依据本专利技术的技术,当其他网友在搜索引擎里搜索其中的一个电子邮箱时,会在当前的搜索框旁边自动显示其它电子邮箱和电话号码,并且,无需打开搜索结果页面。另外,采用本专利技术的输入法在输入上述某一个电子邮箱时,会自动在输入法的操作窗口显不上述的电话号码和其它电子邮箱。这样的例子有很多。保护公众隐私的策略。当年,来电显示功能和手机拍照功能刚刚问世时,人们也担心过隐私问题。另外,博客和网络评论也会涉及隐私问题。所以,应该参照网络产品的通用规则处理折射词所涉及的隐私问题。在产品上注明折射词是否确实与当事人有关联,需要浏览者人工核实。隐私方案不属于本专利技术的限定方案,没有隐私方案的实施行为也在本专利技术的保护范围之内。计算机自动处理公众提交的众多信息,采取一些策略,自动处理那些毫不相干的提交词。比如采用“频度积累”和“动态更新”的方法,可以自动降低毫不相干的提交词在折射词里的排序。本专利技术体现的是众多网友共同参与的原则。并且,本专利技术可以在众多的网友里识别出专家级的网友。专家级的网友使用的“提交词”对其他网友显示之后,会被其他的网友关注,以及会被这些网友作为“提交词”使用,从而成为这些网友的提交词,进而影响计算机的数据统计。所以,专家的提交词会借助众多网友的力量频繁地使用,从而使其提交词的频度被累计的非常高。这样的专家级“提交词”自然会脱颖而出,排名在其它提交词的前面。有时候,用户编辑的几个提交词之间根本没有任何实质性的关联。不过,这没有关系,因为需要众多的“提交串”才能融合成为“总串”,并且,“总串”会动态更新。“总串”里的“词”有频度,频度越高的“词”关联性越强。计算机综合多个用户的“提交串”,经过科学处理之后,得到的“总串”,其频度高的各个跟随词与领头词之间就必然有某种关联性。我们把这些有关联性的词提供给日后的其他用户作为参考词使用。这就是“折射词”技术的基本思路。“折射词”的含义在同一个“总串”里,各个“跟随词”相对“领头词”来说,也叫做折射词;频度越高的“跟随词”与“领头词”之间的折射关系越大。“跟随词”与“折射词”这两种称呼都是相对于“领头词”而言的。“跟随”侧重于表达位置关系,“折射”侧重于表达关联关系。
技术实现思路
本专利技术所要解决的技术问题是提供。用户通过软件窗口或者网页窗口编辑“提交词”,并且,提交编辑的2-N个“提交词”(如图I)。“提交词”可以在用户的本地电脑设备(具备cpu的设备统称为电脑设备)里预处理之后提交给服务器,也可以直接提交给服务器。本专利技术解决该技术问题所采用的技术方案是由计算机处理,把用户通过网络提交的2-N个提交词作为一个提交串,提交串里有多少个提交词就生成多少个衍生串,每个提交词均有一次机会成为对应衍生串的领头词;把同一个用户的多个衍生串以及众多用户的大量衍生串以相同的领头词为前提,添加到一个或者多个总串里,相同的跟随词累计频度,并且,同一个总串里的各个跟随词依据频度排序,从而得到一个或者多个总串。由计算机处理,当用户使用搜索引擎时,每输入一个字符,则使用当前已经输入的全部字符或者部分字符在各个总串的领头词里检索,检索到相同的领头词时,返回一次检索结果,为用户显示一个对应总串里的N个跟随词。由计算机处理,当用户执行网页的搜索时,同时,使用搜索词的全部字符或者部分字符在各个总串的领头词里检索,检索到相同的领头词时,返回一次检索结果,为用户显示一个对应总串里的N个跟随词。由计算机处理,把不同的总串分别生成动态网页或者静态网页,在网页里包含总串的领头词和N个跟随词。当手机接到某个电话号码的来电时,使用来电的电话号码通过网络在服务器的各个总串的领头词里检索,检索到相同的领头词时,返回检索结果,在手机的显示屏上显示对应总串里的N个跟随词(如图3)本文档来自技高网
...

【技术保护点】
一种基于众多用户人工参与而生成折射词的方法,其特征是:由计算机处理,把用户通过网络提交的2?N个提交词作为一个提交串,提交串里有多少个提交词就生成多少个衍生串,每个提交词均有一次机会成为对应衍生串的领头词;把同一个用户的多个衍生串以及众多用户的大量衍生串以相同的领头词为前提,添加到一个或者多个总串里,相同的跟随词累计频度,并且,同一个总串里的各个跟随词依据频度排序,从而得到一个或者多个总串。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:张占平
申请(专利权)人:张占平
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1