一种智能标签生成方法、系统及介质技术方案

技术编号:40501124 阅读:30 留言:0更新日期:2024-02-26 19:28
本申请公开了一种智能标签生成方法、系统及介质,方法包括:获取新闻内容数据并进行清洗;判断识别模型是否为初次构建,若是则根据内容类型进行模型训练并保存;若不是,则利用预设的模型进行内容识别和分类;对分类结果进行智能标签构建,并对分类结果中第二层分类结果下的新闻内容进行无监督聚类;对每个聚类结果下的关键词和实体聚合统计,汇总得出每个类别对应的词库,并存储至预设的智能标签管理系统,得到内容智能标签;基于每个标签以及标签对应的词库,对新获取的新闻内容进行统计分析,计算标签权重并打标,得到智能标签,将智能标签结果与内容数据一同存储。本发明专利技术能够更加精细准确的生成内容智能标签,以便于动态调整管理机制。

【技术实现步骤摘要】

本申请涉及智能标签,具体而言,涉及一种智能标签生成方法、系统及介质


技术介绍

1、传统的新闻内容分类类目较为粗犷,比如时政类别内容,包含的数据内容种类依旧繁多,国内时政、国外时政、中央政务、地方政务等等,这些都属于时政类别大类目之下,这种传统的新闻导航内容分类方式在互联网信息爆炸的时代,仅仅适合作为一个大类的导航;对于新闻内容从业者而言,需要快速精准的获取某个话题内容相关的资料进行媒资素材的管理、整合、生产,传统的新闻内容分类已经无法满足此类需求;对于新闻内容阅读者来说,每天面对海量的信息,用户在一个频道内容下依旧选择困难,有效信息的获取和触达成为了用户对新闻媒介满意度的关键因素。同时,由于主流媒体内容是以时政类、社会类、文化类新闻报道为主,有别于垂直媒体纵深细分的特点,存在内容覆盖面广、政治话语多、理论话语多、学术话语多等挑战,而且学术界和产业界也尚缺一种能有效理解主流媒体内容最新最前沿内容的智能标签生成方法及装置,这也一定程度上影响了主相关形态内容的智能传播和有效触达。

2、因此,亟需一种智能标签生成方法。

r/>

技本文档来自技高网...

【技术保护点】

1.一种智能标签生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种智能标签生成方法,其特征在于,所述对获取新闻内容数据并进行清洗处理具体包括:对获取的新闻内容数据依次进行去重处理、无效内容处理及噪声数据处理。

3.根据权利要求1所述的一种智能标签生成方法,其特征在于,根据内容类型进行模型训练并保存具体包括:

4.根据权利要求3所述的一种智能标签生成方法,其特征在于,对新闻数据中的实体内容采用BIOES标注方法进行标注。

5.根据权利要求1所述的一种智能标签生成方法,其特征在于,利用预设的模型进行内容识别和分类具体包括:...

【技术特征摘要】

1.一种智能标签生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种智能标签生成方法,其特征在于,所述对获取新闻内容数据并进行清洗处理具体包括:对获取的新闻内容数据依次进行去重处理、无效内容处理及噪声数据处理。

3.根据权利要求1所述的一种智能标签生成方法,其特征在于,根据内容类型进行模型训练并保存具体包括:

4.根据权利要求3所述的一种智能标签生成方法,其特征在于,对新闻数据中的实体内容采用bioes标注方法进行标注。

5.根据权利要求1所述的一种智能标签生成方法,其特征在于,利用预设的模型进行内容识别和分类具体包括:

6.根据权利要求1所述的一种智能标签生成方法,其特征在于,所述关键词提取算法包括:tfidf算法、textrank算法。

【专利技术属性】
技术研发人员:张宇宜张凯刘丽芳张健
申请(专利权)人:传播大脑科技浙江股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1