广州神马移动信息科技有限公司专利技术

广州神马移动信息科技有限公司共有142项专利

  • 本发明公开一种查询处理方法。该处理方法包括:从与查询词对应的原链中筛选出文档数小于所述原链的文档数的文档以建立与所述查询词对应的至少一条辅链;根据当前查询业务类别及当前查询词选择与所述当前查询词对应的至少一条辅链进行文档检索形成检索结果...
  • 一种数据分页方法及装置
    本发明公开的数据分页方法,包括获取待显示网页的页码X;计算所述待显示网页的资源数据页的总页数Y;按照预设对应关系确定与所述待显示网页的页码X对应的目标数据页的页码;将所述目标数据页对应的目标数据发送到客户端。相应的,本发明还公开了一种数...
  • 一种数据存储方法、装置及系统
    本发明公开了一种数据存储方法、装置及系统,所述方法包括中间服务器接收项目服务器发送的数据存储请求,所述数据存储请求包括待存储数据、数据标识和预设的项目标识;根据所述数据标识和所述项目标识生成所述待存储数据的键值;将所述键值与所述待存储数...
  • 网络爬虫调度方法及应用其的网络爬虫系统
    本申请公开了一种网络爬虫调度方法及应用其的网络爬虫系统,其首先对抓取到的与种子页相关的内容页数据进行解析,得到多组链接信息,然后根据每组链接信息分别计算得到一个对应的内容页在所述种子页上的链接质量,进而分别根据所述链接质量确定内容页的抓...
  • 本申请公开了一种搜索意图识别方法及装置,其通过获取历史搜索记录中的海量历史搜索语句并对其进行分类,并依此建立分类模型,通过该分类模型挖掘得到与各历史搜索语句相关的候补搜索语句,以同一预设专项类别对应的历史搜索语句及其候补搜索语句来构成该...
  • 网络请求处理方法和装置
    本申请公开了一种网络请求处理方法和装置,其利用PHP语言中数据传输工具CURL的批处理功能模拟多线程处理方式,即首先创建CURL批处理句柄以及与各个URL请求对应的CURL请求,再通过该CURL批处理句柄同时对各个CURL请求进行处理,...
  • 本申请提供了查询词相似度计算方法及装置、查询词搜索方法及装置,其中查询词相似度计算方法包括:确定与第一查询词对应的第一特征向量集合,及,与第二查询词对应的第二特征向量集合;计算所述第一特征向量集合和所述第二特征向量集合的特征相似度;在所...
  • 本申请提供了一种网页加载方法、装置及系统,其中一种方法包括:加载由服务器发送的网页资源;其中,每个模块资源的JS文件均设置于所述主体资源之后;在所述网页资源中加载到每个模块时,在所述每个模块资源中提取运行JS文件所需的JS资源,并将所述...
  • 本发明公开了一种网页渲染方法和装置。该方法包括:将网页中的html标签作为节点并引入CSS信息,以创建包含视觉信息的网页树状结构(VisualTree),其中所述CSS信息包括节点的显示属性;计算所述VisualTree中节点的大小和绝...
  • 页面展示方法和装置
    本发明公开了一种页面展示方法和装置。该方法包括:判断在沿页面展示历史从当前页面回退到先前页面时是否能够从默认缓存中获得所述先前页面的页面内容;在判断无法从所述默认缓存中获得所述先前页面的页面内容的情况下,使用本地第二缓存来缓存页面展示历...
  • 本发明公开了一种信息图网页的信息图提取、检索方法和装置,该信息图网页检索方法包括:服务器根据网页是否满足预定特征识别包含信息图的网页;其中,该预定特征包括以下四类特征中的至少一种:表示信息图关键词的第一类特征、表示网页正文图像数量为一的...
  • 网络内容质量评价方法和装置
    本发明公开了一种网络内容质量评价方法和装置。该方法包括:获取网络内容的内容质量特征,所述内容质量特征包括目录特征、来源质量特征、元信息特征以及主体质量特征中的至少一项特征;计算所述至少一项特征中每一项的特征分值;以及根据所述特征分值计算...
  • 页面展示方法和装置
    本发明公开了一种页面展示方法和装置。该方法包括分析页面文件以确定页面中的主体内容区;以及执行针对所述主体内容区优化的页面显示处理。针对主体内容区进行的优化页面显示可以是根据主体内容区进行阅读进度的确定和显示、页面跳转,直接显示主体内容区...
  • 本发明公开了一种数据存储方法及装置,所述数据包括网页摘要和所述网页摘要的索引信息,所述方法包括:在网页摘要更新时,确定所述网页摘要中的更新字段,以及所述更新字段对应的字段存储区;在所述字段存储区新增加更新存储区,在所述更新存储区存储所述...
  • 本发明公开了一种信息查询方法和设备,该方法包括:将用户输入的自然语言查询文本转换为结构化的抽象查询语言语句;将所述抽象查询语言语句转换为基本查询语句或迭代的多个基本查询语句;针对预先准备的数据库,执行根据所述基本查询语句或所述迭代的多个...
  • 本发明公开了网络负载均衡方法、装置及集群服务系统,所述方法包括:获取集群服务系统中可用的节点的健康度信息;根据所述节点的健康度信息计算所述节点的下发概率,根据所述下发概率选择发送任务请求的对应目标节点;根据选择的所述目标节点发送所述任务...
  • 本发明实施例公开了一种文本选取方法及装置,该方法包括:计算每个候选文本中选定质量特征的错误率,并根据每个候选文本中选定质量特征的错误率计算每个候选文本中对应选定质量特征的容忍度;根据每个候选文本中选定质量特征的容忍度确定对应候选文本的文...
  • 文档的同本识别方法及装置
    本发明公开了文档的同本识别方法及装置,所述方法包括:根据待识别文档的章节目录计算所述文档对应的simhash,并根据所述simhash对所述文档进行分组,再对所述分组后的文档进行同本判定以识别出属于同本的文档。本方法避免采用文档的正文数...
  • 本发明实施例公开了一种网页质量模型的建立方法及装置,该方法包括:从搜索引擎日志中挖掘出所述搜索引擎日志包括的每个网页的选定用户行为指标,根据挖掘出的每个网页的选定用户行为指标计算对应网页的网页质量;从所述搜索引擎日志中提取所述搜索引擎日...
  • 本发明公开了一种存储数据方法和设备。从网页中获取与实体相关的实体相关数据,实体相关数据包括表示实体的实体数据、描述实体的属性的实体属性数据、以及描述两个实体之间的关系的实体间关系数据。将实体数据和与其对应的实体属性数据关联地存储在实体数...