北京智谱华章科技有限公司专利技术

北京智谱华章科技有限公司共有108项专利

  • 本申请公开了一种从中文自然语言中抽取结构化知识的方法及装置,该方法包括:从输入文本中抽取候选实体并对候选实体进行打分,基于开放的实体抽取抽取的实体集,在知识库中检索实体集以完成开放实体链接,基于实体集中实体的优先级重新处理输入文本,并采...
  • 本申请提出一种基于多元标注策略的结构化信息抽取方法和装置,该方法包括:爬取学者的主页,并对主页进行清洗处理和分句处理;通过正则表达式匹配句子并将句子中不同格式的日期统一格式;通过预设的短文本分类模型筛选出包含学者履历的文本;基于多元标注...
  • 本申请公开了一种基于预训练模型的生成式信息抽取方法和装置,该方法包括:获取结构化信息抽取任务的历史标注数据;根据每个目标字段之间的依赖关系,生成学者多轮问题模板,并将标注数据处理为多轮问答形式的数据集;将多轮问题模板序列化,并结合多轮问...
  • 本申请提出了一种基于反向提示的预训练模型文本生成方法,该方法包括:步骤S1:将初始提示文本输入至大规模预训练模型中进行文本生成,生成第一条语句的多个候选语句;步骤S2:对多个候选语句进行文本筛选,按照候选语句的分数从高到低的顺序选择预设...
  • 本发明提出一种基于异构信息网络的新闻事件发现算法及装置,方法包括:对多种话题的新闻进行抽取同时进行预处理,根据各关键词的重要程度选取文章的多个关键词,根据多个关键词生成关键词集合;将关键词集合进行情感信息的融合,经过预测模型预测得到事件...
  • 本申请提出一种学者的主页和所用语言的预测方法,涉及信息处理技术领域,该方法包括获取与学者相关的多个网页并提取每个网页的特征,生成与多个网页对应的网页特征向量矩阵;通过预设的第一训练模型学习每个网页中的文本的语义特征向量,生成与多个网页对...
  • 本申请提出一种面向推荐系统的时空图卷积方法,涉及计算机技术领域,其中,该方法包括以下步骤:维持一个初始的用户嵌入表示矩阵和一个初始的商品嵌入表示矩阵;聚合所述用户和所述商品的邻居信息;获取邻居聚合层输出的用户嵌入表示和商品嵌入表示,并堆...
  • 本申请提出了一种基于图上下文学习的异常点检测方法,涉及计算机网络信息技术领域,其中,该方法包括:提出了CoGCL框架,利用图上下文对比学习来衡量异常与正常节点与图上下文的距离。为了达到对比学习的目的,本专利设计了一个图编码器,它可以一定...