北京中关村科金技术有限公司专利技术

北京中关村科金技术有限公司共有293项专利

  • 一种配置化爬虫质量监测的方法及系统
    本申请公开了一种配置化爬虫质量监测的方法,包括:获取爬虫程序爬取各网站的授权记录参数,并将授权记录参数保存到数据库中;读取配置文件,以得到需要监测的网站ID、监测时间段及报警阈值;从数据库中读取网站ID对应网站的监测时间段的授权记录参数...
  • 一种异常流数据的修复方法、系统及相关装置
    本申请公开了一种异常流数据的修复方法,该方法利用在Redis数据库流数据中能够唯一确定出一系列同源数据的数据标识获取这一系列同源数据的特征信息,并基于该特征信息进行异常判断,将存在异常的同源数据中的原始数据置入消息中间件,以在保证其持久...
  • 机器学习语料的获取方法、系统、装置及可读存储介质
    本发明公开了一种机器学习语料的获取方法、系统、装置及可读存储介质,包括在原始语料库中遍历获取一条原始语料,其中,原始语料包括语料标记及在语料标记下的语料文本;在中间语言集合中遍历获取一种与语料文本的语言类型不同的中间语言类型;将语料文本...
  • 一种标注策略的选择方法及相关装置
    本申请公开了一种标注策略的选择方法,包括:采用多个标注策略对已标注数据集进行模拟标注处理和监督学习训练,并根据处理过程中的指标数据进行回归预测模型训练,得到对应的回归预测模型;当获取到标注任务的指标数据时,利用所有回归预测模型根据指标数...
  • 基于工作流审批单的审批方法、装置及可读存储介质
    本发明公开了一种基于工作流审批单的审批方法,首先以预定义规则从预先保存的多个异常审批单中选取与目标工作流对应的目标审批单,然后确定与目标审批单对应的异常审批环节,最后从异常审批环节开始重新审批目标审批单,因此,对异常的审批单进行再次审批...
  • 意图识别模型的训练方法、系统、装置及可读存储介质
    本发明公开了一种意图识别模型的训练方法、系统、装置及可读存储介质,包括预先根据源任务模型和源任务标注语料训练基础模型;将基础模型的网络层的参数导入到目标任务模型的公共网络层中,并固定公共网络层的参数;通过目标任务标注语料微调目标任务模型...
  • 一种授权爬虫配置化模拟登录的方法及系统
    本申请公开了一种授权爬虫配置化模拟登录的方法,包括:根据用户输入的配置文件生成操作单元,并将操作单元添加至爬虫系统的后端中;当爬虫系统的前端接收到授权请求时,将授权请求及用户输入的授权参数发送至后端;后端调用对应的操作单元根据授权参数完...
  • 一种数据集的标注方法及相关装置
    本申请公开了一种数据集的标注方法,包括:按照预设规则从原始数据中选择未标注数据,得到候选数据集;对候选数据集进行不确定性分析,并根据分析结果进行待标注数据筛选,得到待标注数据集;根据接收到的标注信息对待标注数据集进行标注处理,得到已标注...
  • 一种消息处理方法及系统
    本申请公开了一种消息处理方法,应用于推送服务器,包括:从消息队列中拉取目标消息;根据所述目标消息的消息类型,在程序库中查找对应的目标消息处理程序;执行所述目标消息处理程序以对所述目标消息进行推送;其中,所述程序库包括更新处理程序,所述更...
  • 一种商品的实时推荐方法、系统及可读存储介质
    本申请公开了一种商品的实时推荐方法,包括:获取目标用户已浏览的目标商品的属性数据;其中,所述属性数据包括所述目标商品的关联领域和/或购买周期;向所述目标用户推荐所述关联领域的其他商品,和/或根据所述购买周期推荐所述目标商品或所述目标商品...
  • 一种基于Hbase的SQL查询方法、系统及相关装置
    本申请公开了一种基于Hbase的SQL查询方法,该SQL查询方法将原SQL命令根据包含的SQL子句内容拆分出Elasticsearch SQL和/或Hbase SQL,前者可以利用更强大的、适用性更强的Elasticsearch搜索工具...
  • 一种数据采集任务的控制方法、装置及设备
    本发明公开了一种数据采集任务的控制方法,首先获取与数据采集任务对应的目标数据,然后判断目标数据是否在阈值范围内,若否,则将该数据采集任务作为异常数据采集任务,并暂停异常数据采集任务;因此,针对每一个数据采集任务,实时获取数据采集任务产生...
  • 一种基于对话系统的回答数据生成方法以及相关装置
    本申请公开了一种基于对话系统的回答数据生成方法,包括:对获取的已知意图对话数据进行规则构建处理,得到分类规则集;判断接收的对话数据是否符合分类规则集的识别条件;若对话数据符合识别条件,则利用分类规则集对对话数据进行识别得到意图识别结果;...