当前位置: 首页 > 专利查询>倪毅专利>正文

对象级个性化垂直搜索引擎设计技术制造技术

技术编号：7270873 阅读：321 留言：0更新日期：2012-04-15 17:00

本发明专利技术公开一种对象级个性化垂直搜索引擎的设计技术，该算法其基本思想是：采用自适应垂直爬虫技术获取互联网上相关网页，通过对数据进行语义分析、抽取、集成等一系列对象化处理，获得互联网上的对象化信息，最后以搜索引擎的方式为每个用户返回个性化排序对象结果。采用本技术设计的搜索引擎，通过数据挖掘技术对原始页面数据进行了高度提纯、组织，确保数据的质量，最大程度控制非法信息的收录。此外，其个性化搜索推荐技术能准确判断用户的消费偏好，确保了对用户查询意图的理解。该对象级个性化垂直语义搜索引擎在充分借鉴和吸收语义搜索、对象级搜索、个性化搜索技术优势的基础上，进行集成创新，完全符合下一代搜索引擎的发展方向。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及对象级个性化垂直搜索引擎设计领域的技术研究。
技术介绍
随着WEB2. 0技术的迅猛发展，互联网数据海量增长。如何为互联网用户提供准确有效的信息显得尤为重要。通用搜索的策略是尽量获取数据，但是对数据的处理水平比较低，突出问题就是无效信息过多(噪音数据多)、有效信息不足、有效信息非结构化、返回结果无个性化优化机制。通用搜索中无价值数据比例越高，这些对用户无效的数据浪费了数据中心相当多的存储和运算能力，意味着不仅单次搜索消耗的能源浪费比例高，还会干扰有效信息的提取，致使用户很可能需要进行多次搜索，消耗更多的能源。本专利技术的对象级个性化垂直搜索的策略与通用搜索完全不同。在所垂直的领域内，该技术为用户提供的都是经过整理的、结构化的对象信息，从而大大降低无效信息的比例。其数据处理技术对原始页面数据进行了高度提纯、组织，采用各种方法消除无效数据，在数据处理上要比通用搜索更加深入，确保了数据的质量。每次搜索需要查询的数据量远远小于通用搜索，这意味着本搜索引擎技术对能源的消耗远远小于通用搜索。其突出的语义扩展和个性化推荐技术远远优于通用搜索引擎，根据不同用户特征返回个性化排序结果，确保了对用户查询意图的理解。因此用户使用本搜索引擎看到的是高质量的数据，无须多次翻页，也无须多次检索，就能找到最想要的结果。因此该对象级垂直语义搜索引擎设计技术有极大的经济和社会价值。
技术实现思路
本专利技术公开的垂直领域的对象级搜索技术(Object-Level Search)其基本原理是采用自适应垂直爬虫技术获取互联网上相关网页，通过对信息进行对象级信息抽取、对象级信息集...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：倪毅，张惟师，刘杰，
申请(专利权)人：倪毅，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人