中科嘉速北京并行软件有限公司专利技术

中科嘉速北京并行软件有限公司共有7项专利

  • 一种行业评论数据细粒度情感分析方法
    本发明是一种行业评论数据细粒度情感分析方法,用于互联网数据分析。本方法是:获取电商行业商品的评论数据;对评论数据进行预处理;建立初始的行业情感词库,利用1-gram和2-gram分别计算词在不同情感极性下的分布;对评论数据进行中文分词;...
  • 本发明提供了一种基于深度学习的非监督命名实体语义消歧方法,针对某一特定领域,在垂直网站上抓取评论数据并进行预处理;对评论数据中文分词;利用主题模型对词进行主题聚类,生成包含主题信息的文档主题词分布;对词集合中的所有词,使用基于深度学习的...
  • 一种基于多种信息融合的微博信息过滤方法
    本发明提出一种基于多种信息融合的微博信息过滤方法,属于智能信息处理技术领域。方法包括:步骤1,构建分布式爬虫,抓取微博数据;步骤2,对微博数据进行预处理;步骤3,对微博数据进行中文分词,去除停用词,获取分词结果,得到词集合VOC;步骤4...
  • 本发明提供了一种基于深度学习的命名实体关系抽取与构建方法,用于互联网信息技术领域。本方法针对某一特定领域,在垂直网站上抓取领域内的新闻数据,对获取的新闻数据进行预处理;新闻数据分词,抽取关键词,生成行业词库,利用行业词库对新闻数据重新分...
  • 一种基于图像相似度快速匹配的学术论文搜索方法
    本发明提供了一种基于图像相似度快速匹配的学术论文搜索方法,用于海量论文智能检索。本方法包括:从论文库中获取论文图像库,建立论文图像库的索引;获得要进行搜索的源图像以及图像关键词,并提取源图像的特征矩阵;根据源图像的图像关键词检索论文图像...
  • 本发明提出一种面向微博的动态主题检测与演变追踪方法,属于智能信息处理技术领域。方法包括:步骤1,构建分布式爬虫,获取微博数据;步骤2,对微博数据进行预处理;步骤3,进行中文分词去除停用词,获取词集合VOC;步骤4,对各个时间区间的微博数...
  • 本发明提供了一种基于论文作者信息提取和关系权值模型的学术关系网构造方法。本发明针对特定领域,首先提取作者库中所有作者信息,构建初始的作者关系矩阵,其次建立作者关系权值模型,根据每篇论文的作者信息更新作者关系矩阵,然后基于作者关系矩阵确定...
1