上海语天信息技术有限公司专利技术

上海语天信息技术有限公司共有2项专利

  • 一种网页信息提取系统及提取方法
    本发明公开了一种网页信息提取系统及提取方法,属于网络信息提取技术领域,系统包括网页信息捕捉单元;网址过滤单元,连接网页信息捕捉单元;网页信息提取单元,分别连接网页信息捕捉单元和网址过滤单元;方法包括:预设多个标准网址信息;获取网页的网址...
  • 本发明公开了一种递归多层次中文分词方法,包括:对输入的中文文本使用最大匹配算法进行中文分词,和在当前字典树中对所生成的分词进行选择性地屏蔽,然后重复进行利用屏蔽后的字典树对输入的中文文本再次使用最大匹配算法进行中文分词,和对所生成的分词...
1