北京优捷信达信息科技有限公司专利技术

北京优捷信达信息科技有限公司共有3项专利

  • 本发明公开了一种实时对长文本去重聚类的方法,包括有以下步骤:步骤一,基础设施建设:在中心服务存储建立可以对特征向量进行快速模糊比对的数据结构;在中心数据库建立特征值为主键的文本列表A;在中心数据库建立特征值为主键的文本列表B;步骤二,粗...
  • 一种判别短文本情感倾向性的方法
    本发明公开一种判别短文本情感倾向性的方法,包括:A、直接从待分析文本中构建情感词典;B、根据情感词典,基于局部依赖关系判断待分析文本的情感极性。本发明的目的是提出一种适用于句法不严谨的文本的,能得到短语搭配的情感极性的可行方案。首先是,...
  • 基于关键词抽取的多文本对照方法
    本发明公开一种基于关键词抽取的多文本对照方法。该多文本对照方法包括步骤:A、把自然语言中的每一句话当作是一个隐马尔科夫链,求出词性标注和分词;B、在隐马尔科夫链模型中加入自定义词库,把自定义词库中的词设置为强相关,在标记词性序列的时候,...
1