北京汉仪创新科技股份有限公司专利技术

北京汉仪创新科技股份有限公司共有8项专利

  • 本发明提供一种通用文档型文件结构化方法,包括:步骤S1、获取初始文档型文件;步骤S2、将所述初始文档型文件输入文档分析模型,获得包含若干标记信息的初始文本;步骤S3、根据所述包含若干标记信息的初始文本,采用拼接模型将初始文本拼接为文本序...
  • 本发明提供一种字符缺陷检测方法,所述字符缺陷检测方法应用于汉字字库中的字符检测,包括:步骤S1、获取n个待检测字符的图像;步骤S2、获取第一判别模型,将第i个待检测字符输入所述第一判别模型,得到第i个待检测字符的第一检测结果;步骤S3、...
  • 本发明提供一种字体轮廓生成方法,包括:获取字体轮廓序列信息;根据所述字体轮廓序列信息生成字体轮廓语义特征序列;根据所述字体轮廓语义特征序列计算得到隐空间序列和字体轮廓序列表征信息;获取扩散模型参数,基于隐空间序列和所述扩散模型参数,计算...
  • 本公开涉及基于结构化模型的习题抽取方法、系统、设备和介质,所述方法包括如下步骤:获取用户输入的习题图像,对用户输入的习题图像进行目标检测,检测出文本内容、图表内容和排版区域;对检测出的文本内容进行识别得到文本识别结果,将文本识别结果与所...
  • 本公开涉及一种手写公式识别方法、系统、电子设备和存储介质,所述方法包括如下步骤:将手写公式图像编码为特征图,对特征图中的特征向量进行二维位置编码得到位置编码,将所述位置编码与特征向量相加得到特征图像编码;使用半自回归树解码器对手写公式对...
  • 本发明提供一种图像修补方法,包括:获取配对条件‑图像数据集和大规模图文配对数据集;获取预训练隐变量扩散生成模型;构建条件控制网络,所述条件控制网络与预训练隐变量扩散生成模型同构;基于配对条件‑图像数据集训练条件控制网络,获得训练好的条件...
  • 本发明提供一种海报排版模型的训练方法,包括:获取成品海报数据集、海报前景文字排版数据集;获取预训练隐变量扩散模型的文本‑图像修补模型和预训练光学字符识别模型;基于预训练隐变量扩散模型的文本‑图像修补模型,输入海报前景文字排版数据集,得到...
  • 本发明提供一种文字信息分析模型的构建方法,包括以下步骤:步骤S1:获取待识别文本;步骤S2:将所述待识别文本输入特征提取网络,获得特征矩阵;步骤S3:对特征矩阵进行编码处理,获得编码特征矩阵;步骤S4:将所述编码特征矩阵输入序列建模网络...
1