湖南四方天箭信息科技有限公司专利技术

湖南四方天箭信息科技有限公司共有18项专利

  • 本发明涉及自然语言处理技术领域,提供了一种用户群体聚类方法、装置、计算机设备和存储介质,所述方法包括:获取待聚类用户的公开信息,待聚类用户的公开信息包括用户公开发表的言论文本和用户社交行为数据;基于言论文本进行言论认知特征构建,得到待聚...
  • 本发明涉及计算机技术领域,提供了一种访问方法、装置、终端和存储介质,所述方法包括:获取访问任务,访问任务包括目标网站;从代理缓存队列出队一个候选代理,获取候选代理的被使用次数后,候选代理重新入队;其中,被使用次数包括当前使用候选代理的终...
  • 本发明涉及互联网技术领域,提供了一种APP数据采集系统和方法,包括任务管理层、数据采集层、基础服务层、中间人攻击层和数据处理层;任务管理层用于创建APP采集任务,将所述APP采集任务下发给数据采集层;所述数据采集层用于解析APP采集任务...
  • 本发明涉及人工智能光学字符识别技术领域,提供了一种图像字符识别方法、装置、计算机设备和存储介质,所述方法包括:分别对待识别图像进行字符识别和语义分割,得到文本信息和Mask图像;根据所述文本信息和所述Mask图像确定文本的空格宽度和像素...
  • 本发明涉及计算机视觉技术领域,提供一种视频拆条方法、装置、计算机设备和存储介质,包括:对待处理视频进行时间节点采样,提取各时间节点对应的视频图像特征、视频人脸特征、视频语音特征和视频字幕特征;将各时间节点作为聚类节点两两分组,基于视频图...
  • 本发明涉及计算机视觉技术领域,提供一种合影图像人物分析方法、装置、计算机设备和存储介质,包括获取待分析人物人脸图像的第一高维度特征向量和合影人脸图像的第二高维度特征向量集合;以第一高维度特征向量为首个聚类中心加入聚类中心集合;以聚类中心...
  • 本发明涉及计算机视觉技术领域,提供了一种装备识别方法、装置、计算机设备和存储介质,所述方法包括:获取装备图像,基于多层标签分类体系预测所述装备图像的装备类别,得到候选标签序列;对所述装备图像进行文本检测,基于提取的装备数字型号确定所述装...
  • 本发明涉及实体消歧技术领域,提供了一种军事实体链接方法、装置、计算机设备和存储介质,所述方法包括:获取待链接军事实体以及与所述待链接军事实体相似的候选实体;基于所述待链接军事实体和所述候选实体的实体数值属性、实体类型、实体名称以及实体上...
  • 本发明涉及计算机视觉技术领域,提供了一种人脸摆正方法、装置、计算机设备和存储介质,所述方法包括:获取待摆正人脸图像的关键点组和对应的标准点组;在关键点与对应标准点误差最小的约束下,根据所述关键点组和所述标准点组确定变换矩阵,利用所述变换...
  • 本发明涉及计算机视觉技术领域,提供了一种基于文本骨架的文本检测方法、装置、计算机设备和存储介质,所述方法包括:预测待检测文本图像的文本骨架,得到文本骨架图像;将所述文本骨架图像二值化,根据二值图像确定所述待检测文本图像中各文本框的核心点...
  • 本发明涉及文本处理技术领域,提供了一种嵌套HTML方法、装置、计算机设备和存储介质,所述方法包括:获取HTML文本,得到待解码字符串;将所述待解码字符串输入确定有限状态转译器;按照所述待解码字符串中各字符的顺序以及对应前一个字符的状态位...
  • 本发明涉及文本处理技术领域,提供了一种地址拆分和补全方法、装置、计算机设备和存储介质,所述方法包括:依次以文本中各字符为节点进行拆分和匹配,得到所述文本中存在的地点以及所述地点对应的地点类型;遍历各所述地点,根据所述地点类型从当前遍历地...
  • 本发明公开一种基于模板标注的分布式爬虫方法、装置、计算机装置及计算机可读存储介质,该方法包括:标注目标网页所需抽取的信息项,分别为每个信息项获取两个以上的抽取信息样例;分别根据获取的取信息样例为标注的每个信息项生成对应的信息抽取通式;根...
  • 本发明涉及网络爬虫技术领域,提供了一种基于Chrome插件的爬虫方法、装置、计算机设备和存储介质,所述方法包括:向任务调度中心请求爬虫任务;根据所述爬虫任务请求对应的爬虫标注模板,所述爬虫标注模板预先对目标网页进行模板标注得到;启动Ch...
  • 本发明公开一种分布式锁服务实现方法、装置及计算机设备,该方法包括:接收客户端发送的上锁请求,上锁请求中携带有租约信息以及租约信息对应的至少一个上锁资源;获取预先配置的各个锁之间是否存在冲突的冲突类型配置信息;根据冲突类型配置信息,确定是...
  • 本发明公开一种PDF文件信息抽取方法、装置以及计算机设备,该方法包括:获取待抽取PDF文件,提取待抽取PDF文件中的字符和线条;根据提取的各线条的坐标位置以及各线条之间的位置关系,抽取待抽取PDF文件中的最简表格,最简表格为所有线条均为...
  • 本发明公开了一种网络表格结构的识别方法及装置、计算机装置及计算机可读取存储介质,该方法先通过对输入的HTML文件进行预处理以获取其中的表格相关信息,所述表格相关信息包括单元格文本和单元格所在位置,然后通过利用训练好的网络表格结构识别模型...
  • 本发明公开了一种基于多任务模型进行文本处理的方法、装置、计算机装置及计算机可读取存储介质,该方法利用一个多任务模型即可同时进行分词处理、词性标注和命名实体识别这三个任务,模型加载快、预测时间短,不存在不同预测模型之间的误差传播,整体精度...
1