广州特道信息科技有限公司专利技术

广州特道信息科技有限公司共有66项专利

  • 网评自动发布方法及装置
    本发明实施例公开了一种网评自动发布方法及装置,通过实时获取各个网站的日志,先通过各个网站的日志计算生成每一网站的封网规则,然后通过采集技术获取每一网站可发布的文章或资讯类型,通过调度中心动态调整发帖、回帖和顶贴任务,再根据所述调度中心的...
  • 用户画像构建方法及装置
    本发明实施例公开了一种用户画像构建方法及装置,通过收集用户的日志,根据所述用户的日志获取用户的行为,再对所述用户的行为进行分析,建立用户区分度模型,然后根据用户的阅读兴趣、地域、收入信息及所述用户区分度模型,构建用户画像,可以准确构建用...
  • 生成执行计划的方法、计划单元和分布式NewSQL数据库系统
    本发明公开了一种生成执行计划的方法,包括:判断共享缓存池中是否存在与SQL语句相对应的预存SQL语句,若是,则输出与所述SQL语句对应的执行计划,若否,则对所述SQL语句进行语法检查,若语法错误返回错误信息给用户,否则,对所述SQL语句...
  • 一种写入图片数据和分布式NewSQL数据库系统
    本发明公开了一种写入图片数据的方法,适用于分布式NewSQL数据库系统,包括:以JDCB/ODBC的接口方式接入用户请求,其中,所述用户请求包括需要写入的图片数据;解析所述用户请求,编译以及生成对应的执行计划;根据执行计划,将所述图片数...
  • 社交网络人际关系的分析方法及装置
    本发明公开了一种社交网络人际关系的分析方法,包括步骤:采集微博用户的数据;其中,所述微博用户的数据包括所述微博用户的基本信息和交互内容;根据所述微博用户的基本信息和交互内容获取所述微博用户的初级关系网络;采集线下关系,收集线下场景共现频...
  • 一种分布式NewSQL数据库系统和全文检索方法
    本发明公开了一种分布式NewSQL数据库系统,包括:控制单元,用于以数据库接口的方式接入用户请求,并将所述用户请求发送给计划单元;还用于将查询结果返回用户;其中,所述用户请求包括查询条件;计划单元,用于解析所述用户请求,编译以及生成对应...
  • 实体词识别方法及装置
    本发明公开了一种实体词识别方法,包括步骤:收集结构化数据,通过大数据ETL技术对所述结构化数据进行初步过滤和精简后生成若干个领域的语料库;将每一领域的语料进行训练后生成对应领域的多元实体词库,通过大量文章对每一领域的多元实体词库进行验证...
  • 中文文本的分词方法及装置
    本发明实施例公开了一种中文文本的分词方法及装置,通过接收待分词文本,根据标准词库进行匹配处理后对所述待分词文本进行初始分词,再对所述待分词文本进行初始分词后,通过CRF模型,识别所述待分词文本的场景,然后根据所述待分词的场景,对所述待分...
  • 舆情分析方法及装置
    本发明实施例公开了一种舆情分析方法及装置,通过采用抓取算法进行全网数据定向和顶点采集获得全网各个站点的数据,并采集主流搜索引擎的搜索结果,再基于所述各个站点的数据和搜索结果进行聚类,通过聚类结果获取热点事件,然后自动抽取所述热点事件的摘...
  • 一种分布式NewSQL数据库系统和数据储存方法
    本发明公开了一种分布式NewSQL数据库系统,包括:控制单元,用于以数据库接口的方式接入用户请求,并将所述用户请求发送给计划单元;其中,所述用户请求包括需要写入的数据字段;计划单元,用于解析所述用户请求,编译以及生成对应的执行计划;执行...
  • 一种图片数据查询的方法和分布式NewSQL数据库系统
    本发明公开了一种图片数据查询的方法,适用于分布式NewSQL数据库系统,包括:以JDCB/ODBC的接口方式接入用户请求,其中,所述用户请求包括需要查询的图片数据的查询条件,所述查询结果为根据所述查询条件所获得的查询结果;解析所述用户请...
  • 网页正文抽取方法及装置
    本发明公开了一种网页正文抽取方法,通过下载网页页面,根据所述网页页面获取网页源代码,然后根据所述网页源代码创建DOM树,基于所述DOM树和所述网页页面的页面样式生成视觉树,再基于所述视觉树定位分支结点,采用优选策略在已定位的分支节点中选...
  • 一种分布式NewSQL数据库系统和数据查询方法
    本发明公开了一种分布式NewSQL数据库系统,包括:控制单元,用于以数据库接口的方式接入用户请求,并将所述用户请求发送给计划单元;还用于将查询结果返回用户;计划单元,用于解析所述用户请求,编译以及生成对应的执行计划;执行单元,用于根据执...
  • 社交网络人际关系的分析方法及装置
    本发明公开了社交网络人际关系的分析方法通过先采集微博用户的数据,再根据所述微博用户的基本信息和交互内容获取所述微博用户的初级关系网络,基于所述初级关系网络生成有向连通图,然后分析所述交互内容获得互动频率和互动亲密度,根据所述互动频率和互...
  • 英文文本的分词方法及装置
    本发明公开了一种英文文本的分词方法,包括步骤:采集具有多元语义的网络词库,根据不同领域对所述网络词库进行训练;接收待分词文本,根据所述网络词库对所述待分词文本进行初始分词;对所述待分词文本进行初始分词后,对所述待分词文本进行特征提取,从...
  • 一种基于大数据并行计算的聚类方法及系统
    本发明公开了一种基于大数据并行计算的聚类方法,包括以下步骤:接收大集群多线程并行采集的待聚合数据;将所述待聚合数据保存在第一数据库中;提取所述待聚合数据的数据特征,同一时段多线程并行调用聚类模型独立分布式计算分析所述待聚合数据的聚合类别...
  • 一种高并发并行计算的大数据采集系统及方法
    本发明公开了一种高并发并行计算的大数据采集系统,包括业务数据管理平台、调度中心、采集器、流服务和数据节点;所述业务数据管理平台包括用于根据不同内容和网站特点配置待采集任务的站点配置模块和用于存储并将待采集任务分配给分发服务器的采集规则库...
  • 一种数据库接口单元和分布式NewSQL数据库系统
    本发明公开了一种数据库接口单元,包括:JDBC应用程序模块,用于接收用户请求,以及调用JDBC对象方法以给出SQL语句,并用于提取结果返回用户;JDBC驱动程序管理器模块,用于为所述JDBC应用程序模块加载和调用JDBC驱动程序模块;J...
  • 一种分布式NewSQL数据库系统
    本发明公开了一种分布式NewSQL数据库系统,包括:JDBC/ODBC接口单元,用于接收用户向Master单元发送的用户请求,并将所述Master单元返回的结果以返回用户;Master单元,用于以JDBC/ODBC接口单元接入用户请求并...
  • 一种建立二级索引的方法和分布式NewSQL数据库
    本发明公开了一种分布式NewSQL数据库系统,包括:master单元,用于以数据库接口的方式接入用户请求,并将所述用户请求发送给计划单元;其中,所述用户请求包括需要写入的数据字段;计划单元,用于解析所述用户请求,编译以及生成对应的执行计...