一种市场监管多领域数据标签生成方法及系统技术方案

技术编号:44362003 阅读:22 留言:0更新日期:2025-02-25 09:43
本发明专利技术涉及一种市场监管多领域数据标签生成方法及系统,该方法包括:获取市场监管多领域的历史文本数据并进行数据预处理,得到市场监管文本数据;采用监督微调的方式对大语言模型进行训练,通过训练好的大语言模型提取市场监管文本数据的关键词;通过自然语言处理技术,提取市场监管文本数据的关键词;将多种方式得到的关键词重新组合,进行自然语言处理和同义词推荐处理,整合成最终的标签文本集合。本发明专利技术采用了多种语言模型对数据进行处理,包括自然语言处理技术和基于大模型的文本处理技术。通过不同的模型对同一份数据进行处理,可以提取出更多样化、更全面的关键词和摘要,从而提高标签生成的准确性和覆盖率。

【技术实现步骤摘要】

本专利技术涉及数据信息处理,尤其涉及一种市场监管多领域数据标签生成方法及系统


技术介绍

1、随着大数据和人工智能技术的不断发展,市场监管机构每天需要处理和分析海量的数据,以实现对市场的有效监管。为了更高效地管理和利用这些数据,标签化成为了一种重要的数据处理方式。通过为数据打上标签,可以方便地对数据进行分类、检索和分析,从而提高市场监管的效率和准确性。

2、目前,在市场监管领域中,数据标签的创建主要依赖于人工方式。监管人员根据自身的经验和理解,为数据手动添加标签。这种方式虽然在一定程度上能够满足标签化的需求,但存在着明显的局限性。人工创建标签需要耗费大量的时间和精力,且受个人主观因素的影响较大,难以保证标签的一致性和准确性。


技术实现思路

1、有鉴于此,有必要提供一种市场监管多领域数据标签生成方法,用以解决现有技术的上述缺陷。

2、为了解决上述问题,第一方面,本专利技术实施例提供一种市场监管多领域数据标签生成方法,包括:

3、获取市场监管多领域的历史文本数据并进行数据预处理本文档来自技高网...

【技术保护点】

1.一种市场监管多领域数据标签生成方法,其特征在于,包括:

2.根据权利要求1所述的市场监管多领域数据标签生成方法,其特征在于,所述市场监管多领域的历史文本数据包括消费投诉文本数据,食品、药品、化妆品、特种设备等日常监管活动中产生监管记录数据。

3.根据权利要求1所述的市场监管多领域数据标签生成方法,其特征在于,所述数据预处理,包括:

4.根据权利要求3所述的市场监管多领域数据标签生成方法,其特征在于,所述采用监督微调的方式对大语言模型进行训练,通过训练好的大语言模型提取市场监管文本数据的关键词,具体包括:

5.根据权利要求1所述的市场监管...

【技术特征摘要】

1.一种市场监管多领域数据标签生成方法,其特征在于,包括:

2.根据权利要求1所述的市场监管多领域数据标签生成方法,其特征在于,所述市场监管多领域的历史文本数据包括消费投诉文本数据,食品、药品、化妆品、特种设备等日常监管活动中产生监管记录数据。

3.根据权利要求1所述的市场监管多领域数据标签生成方法,其特征在于,所述数据预处理,包括:

4.根据权利要求3所述的市场监管多领域数据标签生成方法,其特征在于,所述采用监督微调的方式对大语言模型进行训练,通过训练好的大语言模型提取市场监管文本数据的关键词,具体包括:

5.根据权利要求1所述的市场监管多领域数据标签生成方法,其特征在于,在得到最终...

【专利技术属性】
技术研发人员:张军情危明铸
申请(专利权)人:广州中科数能软件有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1