人民搜索网络股份公司专利技术

人民搜索网络股份公司共有42项专利

  • 本发明公开一种网页内容抓取方法及装置。所述方法包括:获取网页的URL信息;识别所述URL信息中包含的路径信息和参数信息;对于路径信息相同的URL信息进行聚类,得到包含多个URL信息的URL信息集;将所述URL信息集中,在每个URL信息中...
  • 本发明公开了一种基于用户阅读兴趣的相关事件生成方法,包括:A、对舆情文档进行数据预处理的步骤;B、通过所述核心文档的正文对事件进行倒排索引,倒排word的初始权重值为TF-IDF值;C、对于历史事件集进行人工标注,标注的内容主要包括事件...
  • 本发明公开了一种基于排序学习技术的热门事件排名方法,该方法包括:A、在线上抓取新闻网页,通过聚类处理将新闻网页映射为事件的步骤;B、为每个事件提取排名所需的各种特征项的步骤;通过特征提取,获得与新闻事件相关的各项特征,为计算模型做输入准...
  • 本发明公开了一种基于网页拓扑结构的网页地理位置识别方法,该方法包括:A、提取网页拓扑结构的步骤;B、提取网页内容的步骤;以及C、计算地区相关性并排序的步骤。利用本发明方法,在网页缺乏地址词时,能够通过对网页拓扑结构和对特殊意义的普通词进...
  • 本发明公开一种提高消息队列系统性能的装置及其方法,包括:生产者模块,用于实现发送策略、连接管理功能;ThriftServer中转层模块,用于实现连接管理、队列与所在主机对应关系查询与维护、统计功能、配额管理功能以及发布消息功能;消费者模...
  • 本发明公开一种分布式网络爬虫系统及其抓取方法,包括参数化控制抓取模块,用于对待抓取的资源按照抓取内容、抓取类型、使用的UserAgent进行参数化配置;垂直频道抓取定制模块,用于管理和约定各个垂直频道的抓取行为,并具有统计功能;统一抓取...
  • 本发明公开一种网络视频点播加速系统及其播放方法,主要包括源服务器和用户主机;其中:所述源服务器,为原始视频服务端或视频网站存储视频文件的服务器;用户主机,包括浏览器和运行于用户主机中用于视频加速所需的客户端软件;所述客户端软件,用于连接...
  • 本发明公开了一种大规模数据下的新闻事件自动挖掘系统及其方法,包括接收模块,接收一个时间片段内推送到所述事件挖掘系统的新闻数据,并将上一时间片段内积攒的新闻数据发送给聚类处理模块进行事件挖掘;聚类处理模块,对接收到的新闻数据按照彼此间的标...
  • 本发明公开了一种网络舆情地域相关度的计算方法,该方法包括多层次相似度计算的过程及多层级地址融合的过程;所述多层次相似度计算的过程:A、初始化不同层级的地址词权重,针对不同层级的地址词设定不同的初始权重;B、根据全局信息调整地址词的权重、...
  • 本发明公开了一种实时新闻的展现装置及其方法,该装置包括新闻采集和预处理模块、新闻分频道模块、实时新闻处理模块、实时新闻存储模块和前端模块;其中:新闻采集和预处理模块,用于实时的从互联网采集新闻,并进行预处理;新闻分频道模块,用于对所采集...
  • 本发明公开了一种基于动态话题模型的动态文本聚类装置及其方法,该装置包括新闻采集模块、新闻初始特征提取模块、动态特征变换模块和动态聚类模块,其中:新闻采集模块,用于采集互联网上的新闻数据;新闻初始特征提取模块,用于对所采集的新闻数据进行初...
  • 本发明公开了一种特定领域信息自动化组织的装置及其方法,该装置主要包括:新闻采集模块,用于采集网络新闻;新闻筛选模块,从采集的新闻中筛选出特定领域的新闻;新闻话题检测模块,对特定领域的新闻进行话题检测;后台信息缓存模块,缓存按话题组织的特...
  • 本发明公开了一种基于文档签名技术的相似文档识别装置及方法,主要包括内容提取模块,特征抽取模块,文档签名计算模块,文档签名索引模块以及相似文档查找模块。采用本发明,能够解决现有相似文本识别技术中空间复杂度高、无法应对文本流式处理的应用需求...
  • 本发明公开了一种基于查询日志的新词自动查找系统及方法,主要包括:查询日志预处理模块,用于根据设置的定时新词发现的时间,定期从查询日志中获取定时间隔的这一段时间内的查询串及查询频次等;新词发现模块,根据所述查询串的分词结果,统计相同n-g...
  • 本发明公开了一种基于分布式多级聚类的话题检测装置及方法,该装置主要包括新闻采集模块、新闻分类模块、话题检测模块和话题整合模块以及话题展示模块;该方法包括:题检测方法,其特征在于,该方法包括:A、对新闻进行采集的步骤;B、对所述新采集的新...
  • 本发明公开了一种基于话题的新闻检索装置及方法,包括采集分析模块、聚类处理模块、索引建立模块、查询排序模块以及结果输出模块;其中:采集分析模块,用于采集新闻网页,并提取相应的特征;聚类处理模块,用于对新闻网页聚类,产生话题及其特征向量;索...
  • 本发明公开了一种基于点击力度的触摸屏设备解锁装置及方法,包括作为输入装置的触摸屏,还包括力度感知模块,用于记录用户每次点击触摸屏的力度和时间间隔,以利于形成个性化的解锁密码。采用本发明,通过记录用户设定的锁屏解锁节奏,包括点击的时间间隔...
  • 本发明公开了一种基于按键节奏或按键力度变换的数字加解密方法,该方法包括:用户设置密码时,采用一定的按键节奏或按键力度输入设定的密码的步骤;以及在验证用户密码时,采用所述一定的按键节奏或力度输入设定的密码的步骤。采用本发明的方法,能够在原...
  • 本发明公开了一种基于空间运动的加密解密系统及方法,主要包括:运动感知模块,用于接收方位传感器硬件产生的方位数据;密钥生成模块,用于处理所述方位数据,将该方位数据转化成向量表示以作为用户密钥;加密模块和解密模块,采用DES、AES或其他任...
  • 本发明公开了一种基于光感技术的输入法切换装置及方法,运行在装有摄像头的移动设备;该装置主要包括:摄像头,用于接收光线感应信号,并将该信号发送给输入法切换模块;输入法切换模块,用于接收摄像头传来的光线感应信号,根据光线感应信号的不同,分别...