北京百度网讯科技有限公司专利技术

北京百度网讯科技有限公司共有17198项专利

  • 本发明公开了一种确定站点的领域信息以及相关性判定方法、系统及设备,主要内容包括:针对站点内的每一页面,确定该页面相对于预设的多个主题中每个主题的似然度,并根据每个页面对于各主题的似然度来表示页面所属站点的主题分布,进而来确定站点对应的领...
  • 本发明提供了一种针对搜索请求抽取搜索结果中的主题标签的方法和装置,针对用户输入的搜索请求(query)的搜索结果执行以下步骤:A、对搜索结果中的各页面进行分词处理,并对分词处理后得到的各词语进行过滤处理,得到query对应的候选标签集合...
  • 本发明公开了用户网络行为的分类方法和装置及对应的搜索方法和装置。分类方法包括:获取用户行为数据,用户行为数据为用户在搜索引擎的所输入的搜索请求(query)以及用户在相应搜索结果页的点击行为信息;分别对相同query对应的点击行为信息进...
  • 本发明提供了一种同义词的挖掘方法和装置,其中方法包括:从搜索日志中,搜索请求(query)及其对应的搜索结果中被点击或浏览的网页标题,或者,被点击或浏览的网页标题对应的不同query,获取由短语对构成的同义词的候选资源;从候选资源的各短...
  • 基于扩展文本信息来确定资源类型的方法、装置及设备
    本发明提供一种基于扩展文本信息来确定资源类型的方法、装置及设备。其中,根据本发明的方法,先将预建立的资源相关文本信息集合所包含的多个资源相关文本信息进行合并处理,以获得分别与所述多个资源相关文本信息相关的多个资源的扩展文本信息,其中,所...
  • 本发明提供了一种同义词模板的挖掘方法和装置以及同义词的挖掘方法和装置,其中同义词挖掘的方法包括:利用预先设置的同义词模板,查找网页中的同义标记符;在所述网页中同义标记符前后的设定距离范围内,按照所述同义词模板中所述同义标记符对应的同义词...
  • 本发明公开了一种涉及网络百科用户管理系统及其制作方法、应用的访问方法。所述系统包括:应用管理模块,所述应用管理模块包括:ID存储单元,存储有为所述每个百科应用分配注册的唯一标识ID;通用权限管理单元,其抽离并独立出各个所述百科应用的包括...
  • 本发明提供了一种语音解码的方法及装置,其中语音解码的方法包括:A.从待解码的语音特征流中获取当前语音特征帧;B.利用当前语音特征帧对当前的各条解码路径进行扩展;C.利用语音短时平稳特征从扩展后的各条解码路径中选取一条以上的解码路径作为当...
  • 一种用于对检索数据进行缓存管理的方法与设备
    本发明的目的是提供一种用于对检索数据进行缓存管理的方法与设备。其中,检索缓存管理设备获取查询序列的检索属性;根据所述的检索属性,检测查询序列相对应的存储在第一缓存空间中的检索数据是否满足迁移的第一触发条件;如果满足第一触发条件,将数据从...
  • 用于确定资源描述信息的准确度信息的方法、装置和设备
    本发明提供一种用于确定资源描述信息的准确度信息的方法、装置及设备。根据本发明的方案先由预建立的资源描述信息集合所包含的多个资源描述信息中选择待处理资源描述信息;接着,再获取所述待处理资源描述信息所包含的各个关键词在所述其他资源描述信息中...
  • 本发明提供了一种试验性抽样展示方法,包括:S1,通过网络协议接收包含URL的查询命令;S2,判断所述查询命令是否需要抽样展示;S3,若是,则将需要抽样展示的所述查询命令分发至处理模块进行处理,并返回处理后的抽样页面;S4,若否,则调取原...
  • 本发明提供了一种相关度计算方法和装置,其中方法包括:对用户输入的搜索请求(query)进行分词处理;利用分词处理后得到的各词语所对应的需求类型概率,对所述query进行需求类型的识别;分别计算所述query在识别出的各需求类型上与页面之...
  • 本发明提供了一种建立问句生成模型的方法和装置以及问句生成方法和装置,建立的问句生成模型包括:问句模板与搜索请求(query)之间的对应关系以及各query到对应问句模板的概率;其中建立问句模型的方法包括:从搜索日志中,统计各query以...
  • 本发明提供了一种索引建立方法、搜索方法和搜索结果排序方法及对应装置,其中建立索引的方法包括:对页面进行分词和词性标注;基于语义分析或页面中的视觉特征中的至少一种,从分词处理后得到的各词语中确定实体词以及该实体词对应的属性词并分别进行标注...
  • 本发明提供一种搜索引擎及其实现方法,其方法包括:用于接收当前用户搜索的原始查询;识别原始查询中包含的原词、包含该原词和其同义词的潜在同义词对、以及该潜在同义词对的同义语境;判断所述同义语境和原始查询是否匹配,且当两者匹配时,将所述同义词...
  • 本发明涉及互联网信息处理领域,特别涉及一种基于非线性统一权值对检索结果进行排序的方法及装置,用于提高搜索引擎的检索结果排序的精准性。该方法为:根据用户输入的检索关键词获得对应的检索结果;分别计算每一个检索结果的非线性统一权值,所述非线性...
  • 本发明提供了一种提取页面主题的方法和装置,其中方法包括:A、获取页面中表达页面主题的候选段落;B、如果存在可再分段的候选段落,则对可再分段的候选段落进行分段处理;否则执行步骤C;C、分别计算步骤B之后得到的各段落的置信度;D、将置信度满...
  • 本发明提供了一种挖掘相关实体词的关系关键词的方法和装置及其应用,其中挖掘关系关键词的方法包括:挖掘实体词e1的相关实体词e2,将所述e1及其相关实体词e2存储在数据库中;在挖掘所述e2所使用的资源,和/或,在由所述e1和所述e2构成一个...
  • 本发明提供了一种通讯录人名的语言模型建立方法、语音搜索方法及其系统,从文本搜索的搜索日志中搜集人名信息;获取对搜集到的人名信息进行的音节标注;利用对人名信息进行的音节标注训练人名音节语言模型。还可以进一步将人名音节语言模型和数字概率模型...
  • 本发明涉及互联网信息处理领域,公开了一种对检索结果进行排序的方法及装置,该方法为:根据用户输入的检索关键词,获取相应的检索结果,以及获取对应各检索结果预设的领域属性;根据所述各检索结果的领域属性,计算所述检索关键词的领域属性;根据所述各...