北京千里马网信科技有限公司专利技术

北京千里马网信科技有限公司共有6项专利

  • 本申请提供一种标讯信息去重的方法、装置、设备和可读存储介质,该方法包括,聚合待去重标讯信息集合中同一项目的标讯信息,得到多个标讯信息集合;确定多个标讯信息集合中每一标讯信息集合内的相同或者相似标讯信息;去重相同或者相似标讯信息。通过该方...
  • 本发明实施例提供一种招投标文件字段抽取方法、装置、设备及介质,涉及文件数据处理技术领域。所述招投标文件字段抽取方法包括:收集多个历史招投标文件,分别将每一历史招投标文件中所有预设信息类别的字段作为一个训练样本,得到训练样本集,并对训练样...
  • 本申请提供一种判断招投标数据的方法、装置、设备和可读存储介质,该方法包括,将待判断标讯信息进行分词处理,得到多个标讯分段;根据招投标数据的特性,将多个标讯分段加权求和,得到第一权重;确定多个标讯分段中的关键词与待判断标讯信息的相关度权重...
  • 本申请实施例提供一种标文类型识别方法、装置、设备及存储介质,涉及文本识别技术领域。所述方法包括:利用预先训练好的结构化模型对待识别标文进行结构化处理,得到包含若干文本信息区域的结构化文本;确定所述结构化文本的目标文本信息区域,并基于预设...
  • 本申请实施例提供一种标文的地区信息识别方法、装置、设备及存储介质,涉及文本识别技术领域。所述方法包括:确定待处理标文的模板配置地区属性,并根据模板配置地区属性获取对应于待处理标文的地区匹配信息库;基于预设的屏蔽处理规则集合对待处理标文中...
  • 本申请提供了一种数据分类标签识别的方法、装置、存储介质及电子设备,该方法包括:对招标文件进行划分,得到文本区域,其中,所述文本区域包括以下中的至少一种:标题区域、正文区域、附件区域和设定标签相关信息区域;基于设定标签,对所述文本区域中的...
1