湖南星汉数智科技有限公司专利技术

湖南星汉数智科技有限公司共有52项专利

  • 本发明适用于互联网技术领域,提供了一种中文语义角色标注方法、装置、计算机装置及计算机可读存储介质,该方法包括:对预先获取的训练集的中文语料进行处理,得到训练集的词的最终表示;对预先获取的验证集的中文语料进行处理,得到验证集的词的最终表示...
  • 本发明属于计算机视觉技术领域,公开了一种人脸图像相似度计算方法、装置、计算机装置及计算机可读存储介质,所述方法包括:输入符合预设尺寸阈值的第一图像和第二图像;分别检测所述第一图像和第二图像中是否存在人脸图像,如果不存在,则终止进程;如果...
  • 本发明适用于互联网技术领域,公开了一种实体消歧方法、装置、计算机装置及计算机存储介质,所述方法包括:构建待消歧实体的基因;根据所述待消歧实体的语义特征从实体库中确定候选实体,其中,所述待消歧实体的语义特征包括名字形式相似性、简称信息及指...
  • 本发明属于图像识别领域,公开了一种车牌识别方法、装置、计算机装置及计算机可读存储介质,所述车牌识别方法包括:获取待识别车牌图像,对所述待识别车牌图像进行灰度化处理,得到第一车牌图像;所述第一车牌图像中至少包括一个矩形;提取所述第一车牌图...
  • 本发明适用于互联网技术领域,提供了一种作者信息抽取方法、装置、计算机装置及计算机可读存储介质,该作者信息抽取方法包括:获取网页文本,提取所述网页文本中符合预设关键字集合的词语;获取与所述词语在所述网页文本中的位置相匹配的预设作者信息抽取...
  • 本发明适用于互联网技术领域,提供了一种网页正文提取方法、装置、计算机装置及计算机可读存储介质,该网页正文提取方法包括:构建DOM树,根据DOM树中的h标签的文本与title标签的文本的相似度,确定网页标题位置;对所述DOM树进行过滤,获...
  • 一种网页表格数据自动抽取方法及装置
    本发明公开了一种网页表格数据自动抽取方法及装置,所述方法包括:获取含有Table标签的网页内容,并将网页内容解析为DOM树结构;对DOM树结构中含有Table标签的表格数据进行分层,再逐层筛选,直到得到需要处理的表格数据;利用需要处理的...
  • 一种基于句法依赖的实体属性信息抽取方法及装置
    本发明公开了一种基于句法依赖的实体属性信息抽取方法及装置,该方法首先对待抽取文本进行预处理,得到待抽取文本实体;然后根据待抽取文本的句法依赖和词性关系,建立词语之间的无向有权图,根据词性关系得到待抽取文本实体的候选属性信息;搜索待抽取文...
  • 一种基于流式处理框架的大规模数据处理装置及方法
    本发明公开了一种基于流程处理框架的大规模数据处理装置及方法,该装置包括:拓扑构建模块,用于根据XML配置文件构建数据处理拓扑;数据读取模块,用于从数据源读取带有标记的原始数据,并根据标记加载逻辑配置文件,得到附加逻辑配置的数据;数据处理...
  • 一种句子语义相似度计算方法
    本发明公开了一种句子语义相似度计算方法,包括以下过程:通过深度学习模型分别对第一句子、第二句子进行特征提取,得到第一句子全局语义向量和第二句子全局语义向量;通过特征工程分别对第一句子的单词、第二句子的单词进行特征提取,得到第一句子局部语...
  • 一种基于流式处理框架的大规模数据处理装置及方法
    本发明公开了一种基于流程处理框架的大规模数据处理装置及方法,该装置包括:拓扑构建模块,用于根据XML配置文件构建数据处理拓扑;数据读取模块,用于从数据源读取带有标记的原始数据,并根据标记加载逻辑配置文件,得到附加逻辑配置的数据;数据处理...
  • 一种图片验证码处理方法及装置
    本发明公开了一种图片验证码处理方法及装置,所述图片验证码处理方法包括:对样本集进行预处理;预处理后的样本集聚类产生K‑Means模型;通过K‑Means模型得到样本集的多维数组数据,利用PCA法对多维数组数据降维并取出数据的典型特征,得...