陕西优百信息技术有限公司专利技术

陕西优百信息技术有限公司共有8项专利

  • 本发明提供一种基于改进的WMD文本相似度计算方法,步骤包括:对目标词进行依存句法分析;根据所述依存句法分析结果构建所述目标词的子树和子树集合;利用节点加权向量,计算每个所述子树的向量表示,将所述子树中的节点信息融入向量中;计算得到整体结...
  • 本公开涉及一种构建词向量表示模型和词向量表示的方法、装置及设备,上述方法包括:针对待训练语料中目标词的上下文,确定上下文中每个词对应的训练初始义原;对义原库中的初始义原向量进行正交化处理,得到正交义原向量;在正交义原向量中确定与训练初始...
  • 本申请实施例涉及一种文本相似度确定方法、装置、电子设备及存储介质,通过对获取的第一文本和第二文本分别进行预处理,获得第一分词序列及第二分词序列;提取第一分词序列和第二分词序列的共现词和非共现词,并基于共现词和非共现词的数量确定第一权重系...
  • 本实用新型公开了一种用于计算机开发的固态硬盘测试架,涉及计算机开发技术领域,包括底座;设置在所述底座上表面用于拓展线路的拓展组件;可拆卸式安装在所述底座上表面的支撑板;以及设置在所述支撑板上表面用于辅助安装固态硬盘的安装单元,所述拓展组...
  • 本发明公开了一种企业物料清洗服务系统及其数据清洗方法,数据采集模块,用于采集企业物料原始数据;规则库模块,根据企业自身需求定义数据清洗校验规则及权重占比;数据预处理模块,用于识别部分参数错误、缺失、重复、字形相近并根据余弦定理与编辑距离...
  • 本发明提出了一种应用系统接口集成系统、集成方法、设备及存储介质,从客户端获得配置信息,配置信息是关于数据目标系统数据集成规则的信息;服务器获取数据集成所需的配置信息,调用数据采集模块,并根据所述配置信息从数据源头系统中获取数据进行处理得...
  • 本发明公开了一种物料数据长描述对应小类名称分类方法。本发明物料数据的小类类别的分类,首先能准确分析数据中存在的问题,如大小写/全半角、连接符、单位不统一,读音相似问题,进行合理的数据预处理过程,将数据规范化、标准化,然后转化成特征向量的...
  • 一种数据清洗方法
    本发明公开了一种数据清洗方法,通过数据导入,将待处理数据经过解析后生成具体的数据存入数据清洗方法;数据预处理,将解析后的数据按照所选处理规则进行数据的提取后生成待清洗的数据;数据清洗,将待清洗数据进行聚类;数据缓存,根据用户的操作命令将...
1