重庆誉存大数据科技有限公司专利技术

重庆誉存大数据科技有限公司共有55项专利

  • 一种基于Cox回归预测的企业风险失信模型,将所述失信模型的失信生存概率,记为f(D),以企业失信模型特征Y为协变量或交互项,所述失信模型的构建方法如下:Q1:确定失信模型特征Y,Q2:制定失信模型观察起始时间D1,Q3:制定失信观察时间...
  • 本发明公开了一种企业新闻数据风险分类方法,包括如下步骤:根据确定企业的公司名称获取该确定企业的相关属性,将所述相关属性两两组合并以此为关键词进行搜索,获取与该确定企业相关的新闻材料,并从所述新闻材料中提取出含有所述相关属性的句子;将含有...
  • 本发明公开了一种结合深度学习和逻辑规则的企业新闻数据风险分类方法,包括如下步骤:从新闻材料中提取出含有确定企业相关属性的句子;将含有相关属性的句子输入CNN句子分类模型中,得到每个句子的句子分类;将每个句子分类分别进行加权处理,得到当前...
  • 本发明公开了一种基于BiLSTM和条件随机场的实体属性抽取模型,包括如下步骤:1)将训练样本语料按字进行标注,作为输入文本进行one‑hot编码,得到one‑hot编码后的输入文本矩阵;2)将one‑hot编码后的输入文本矩阵输入到Em...
  • 本发明公开了一种旅行社用户多维信息画像的构建方法,包括如下步骤:获取样本用户的特征向量和用户画像信息;为样本用户每个标签分配权重;设置需要聚类的簇的个数k和相似度阈值θ;根据样本用户的标签向量,分别计算每两个样本用户之间的相似度;计算邻...
  • 本发明公开了一种基于实体抽取的工商变更分析方法包括如下步骤:定义训练样本的实体类别和属性结构;训练样本语料的准备和打标;采用双向长短期记忆网络和条件随机场的结合,训练实体属性抽取模型;抽取出目标用户变更前和变更后的实体属性;对抽取出的目...
  • 本发明公开了一种对企业进行风险量化评估的方法及六棱星模型,包括一级指标、二级指标、三级指标,所述二级指标由经营状况、行业状况、创新能力、团队相关、合规程度、社会影响力组成;所述三级指标为所述二级指标所对应的细化指标;所述二级指标由对应的...
  • 本申请提供了一种风险识别方法,用于对企业失信风险进行识别,所述方法包括:将所述企业失信风险的测试数据输入至决策树模型,供所述决策树学习以生成失信风险识别模型;获取所述企业失信风险的待预测数据;将所述企业失信风险的待预测数据输入至所述失信...
  • 本发明提供一种文本去重方法,包括以下步骤,目标文本数据预处理步骤;生成目标文本正文局部敏感哈希值和目标文本标题局部敏感哈希值步骤;去重步骤。本发明针对网络文本独有的特性,在应用SimHash算法的策略上做出调整,在以新闻文本背后事件为主...
  • 一种企业知识图谱属性抽取方法及系统
    本发明提供一种企业知识图谱属性抽取方法,包括以下步骤:定义实体类别和事件类别;对每一类实体定义属性结构;语料准备和打标;实体属性抽取;实体属性融合。本发明=结合专家对具体领域实体属性的知识与机器学习对文本内容抽取与分类的客观性、高效性,...
  • 一种基于风险传导模型的企业评估方法及系统
    本发明提供一种能够基于企业及雇员风险传导关系,能够准确评估企业风险的企业评估方法,包括以下步骤,获取节点信息,建立风险传导网络;获取节点的风险初始值;定义节点风险传导函数和关系风险传导函数;训练风险传导模型。发明通过建立网络风险传导模型...
  • 一种风险信息评估方法及系统
    本发明提供一种风险信息评估方法系统,包括以下步骤:对风险信息进行识别和分类,建立内部风险子系统和外部风险子系统;将风险因素定义为风险计算因子并对各风险计算因子赋值;建立内部风险子系统矩阵和外部风险子系统矩阵,对内部风险子系统矩阵和外部风...
  • 一种投资关系网络可视化分析方法及系统
    本发明属于计算机技术领域,提供了一种投资关系网络可视化分析方法及系统,包括获取企业名称,将所述企业设为核心企业;搜索核心企业股东信息并存储到结构化数据库中,所述股东信息包括股东名称和股东类型;识别股东类型判断股东性质,所述股东性质包括自...
  • 一种互联网重复信息筛选方法及系统
    本发明公开了一种互联网重复信息筛选方法及系统,所述系方法包括:根据预设关键字,获取互联网的相关文本信息;从所述文本信息中选取信息源样本和对比样本;分别对所述信息源样本和所述对比样本进行分解;根据分解后的所述信息源样本和所述对比样本,计算...
  • 一种网络信息语义倾向分析方法及系统
    本发明属于计算机技术领域,提供了一种网络信息语义倾向分析方法及系统,包括获取企业名称;使用网络爬虫在互联网上搜索与该企业相关的信息,并将这些信息以文本的形式存储在数据库中;使用分词器将上述文本分解为符合逻辑的词语序列,并将词语序列存储在...