广东数源智汇科技有限公司专利技术

广东数源智汇科技有限公司共有12项专利

  • 本发明涉及一种基于大语言模型和主题模型的网民观点分析方法。本发明通过综合考虑不同维度的信息,如TF‑IDF、关键词、主题模型和命名实体识别等,能够准确地分析和总结网民观点,并生成准确的观点情感结果。它能够从多个角度分析观点,发现不同维度...
  • 本发明涉及一种社群识别和动态跟踪方法。本发明提供的跟踪方法能够较好的采集并利用现有的社交媒体的高维数据,把社媒数据从高维到低维的降维,减少数据维度,有效提高计算效率;通过降维可以识别最具信息量的特征,充分挖掘高维数据中的有效信息,提高海...
  • 本发明涉及一种基于多模态融合算法的舆情风险发现方法。本发明可以综合分析多种类型的数据,提高数据挖掘的深度和全面性;可以发掘文本与图片、文本与视频等之间的关联信息,有助于更全面地揭示舆情风险的真实情况;能够整合来自不同模态的信息,其对舆情...
  • 本发明涉及一种海外社交媒体语言与地域预测方法。本发明通过分析博主发布的推文中使用的语言种类,对博主所在地域进行初步推测;分析博主关注的用户和互动最频繁的用户的地域信息,通过对这些关联人员地域数据的统计和分析,为博主地域预测提供进一步的依...
  • 本发明涉及一种舆情事件中提取重要观点的方法。本发明利用了机器学习和算法模型,基于互信息和左右交叉熵从海量文本中抽取出行业内特定短语和专有名词,基于glove模型利用行业内语料训练词向量模型,利用词向量召回与“说”和“表示”的近义词,抽取...
  • 本发明涉及一种政务舆情知识图谱的构建方法。本发明基于bert模型,将实体抽取任务转换成问答任务,同时基于机制,通过构建领域内问答模板,从而提高模型的泛化能力,并且在图谱生成阶段通过前处理和后处理构建专业的政务舆情知识图谱。在数据的抽取上...
  • 本发明涉及一种营商政策系统的构建方案及系统。本发明基于大数据平台能力,获取国内政府网站全部公开政策资讯,多重组合算法区分政策和资讯信息,包括站点算法、板块算法、链接算法、索引算法,融合线下汇编政策,保障数据广度,同时,构建营商环境知识图...
  • 本发明涉及一种基于多语种舆情预警的方法。本发明通过数据语种判断,进行归类翻译,满足中文用户简单阅读海内外全媒体数据的关键点;通过相近事件信息算法,实现简称、缩写、错别字、相近错别字、近义词等内容的识别,并进行相近信息事件归类,达到信息相...
  • 本发明涉及一种从新闻内容中提取品牌信息并计算品牌指数的方法。本发明所提供的方法可以方便提取新闻图片,根据图片进行筛选过滤的算法,是一种提取主要文章内容坐标的技术,可以有效修正识别品牌词、成语等错误词语,完整提取出新闻内容,得到文章中相关...
  • 本发明提出了一种面向电商数据的商标侵权分析方法,通过构建商标检测模型和商品检测模型;利用商品检测模型提取品牌商的标准商品特征信息,并确定应用商标检测模型中哪几种商标分类进行检测;获取待侵权判断的商品特征信息并设置侵权阈值,计算每种商品的...
  • 本发明公开了一种搜索引擎的千人千面程度测评方法、系统及计算机可读存储介质,方法包括以下步骤:S1:定义品牌的用户群体;S2:根据已定义的用户群体设置虚拟用户,根据虚拟用户设计养成计划;S3:定义虚拟用户养成的成功指标及搜索引擎千人千面的...
  • 本发明公开了一种基于图片信息聚类的信息批量提取方法、系统及计算机可读存储介质,方法包括:从待识别的图像中提取出商品对象和文字对象并分类编号,确定每个对象的坐标系;对得到的不同对象边缘打点并确定所打点的坐标;将相邻的不同类对象利用边缘点进...
1