【技术实现步骤摘要】
本申请涉及智能标签,具体而言,涉及一种智能标签生成方法、系统及介质。
技术介绍
1、传统的新闻内容分类类目较为粗犷,比如时政类别内容,包含的数据内容种类依旧繁多,国内时政、国外时政、中央政务、地方政务等等,这些都属于时政类别大类目之下,这种传统的新闻导航内容分类方式在互联网信息爆炸的时代,仅仅适合作为一个大类的导航;对于新闻内容从业者而言,需要快速精准的获取某个话题内容相关的资料进行媒资素材的管理、整合、生产,传统的新闻内容分类已经无法满足此类需求;对于新闻内容阅读者来说,每天面对海量的信息,用户在一个频道内容下依旧选择困难,有效信息的获取和触达成为了用户对新闻媒介满意度的关键因素。同时,由于主流媒体内容是以时政类、社会类、文化类新闻报道为主,有别于垂直媒体纵深细分的特点,存在内容覆盖面广、政治话语多、理论话语多、学术话语多等挑战,而且学术界和产业界也尚缺一种能有效理解主流媒体内容最新最前沿内容的智能标签生成方法及装置,这也一定程度上影响了主相关形态内容的智能传播和有效触达。
2、因此,亟需一种智能标签生成方法。
r/>技本文档来自技高网...
【技术保护点】
1.一种智能标签生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种智能标签生成方法,其特征在于,所述对获取新闻内容数据并进行清洗处理具体包括:对获取的新闻内容数据依次进行去重处理、无效内容处理及噪声数据处理。
3.根据权利要求1所述的一种智能标签生成方法,其特征在于,根据内容类型进行模型训练并保存具体包括:
4.根据权利要求3所述的一种智能标签生成方法,其特征在于,对新闻数据中的实体内容采用BIOES标注方法进行标注。
5.根据权利要求1所述的一种智能标签生成方法,其特征在于,利用预设的模型进行内容识别和
...【技术特征摘要】
1.一种智能标签生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种智能标签生成方法,其特征在于,所述对获取新闻内容数据并进行清洗处理具体包括:对获取的新闻内容数据依次进行去重处理、无效内容处理及噪声数据处理。
3.根据权利要求1所述的一种智能标签生成方法,其特征在于,根据内容类型进行模型训练并保存具体包括:
4.根据权利要求3所述的一种智能标签生成方法,其特征在于,对新闻数据中的实体内容采用bioes标注方法进行标注。
5.根据权利要求1所述的一种智能标签生成方法,其特征在于,利用预设的模型进行内容识别和分类具体包括:
6.根据权利要求1所述的一种智能标签生成方法,其特征在于,所述关键词提取算法包括:tfidf算法、textrank算法。
【专利技术属性】
技术研发人员:张宇宜,张凯,刘丽芳,张健,
申请(专利权)人:传播大脑科技浙江股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。