目标数据信息的获取方法及装置、电子设备以及存储介质制造方法及图纸

技术编号:41205977 阅读:18 留言:0更新日期:2024-05-07 22:32
本发明专利技术提供了一种目标数据信息的获取方法及装置、电子设备以及存储介质。目标数据信息的获取方法包括:对第一数据信息进行主题词集提取得到主题词集合;根据主题词集合得到第一数据信息所属的第一数据集合;根据第一数据集合确定第一数据集合的专业领域;根据第一数据集合的专业领域确定第一数据集合中第一数据信息的专业领域;基于第一数据信息的专业领域与目标领域相同,则将第一数据信息作为目标数据信息。本发明专利技术所提供的目标数据信息的获取方法,一方面避免了人工筛选关键词从而导致筛选数据时会漏掉很多专业领域数据的问题,另一方面通过主题词集合还避免了获取到很多嘈杂数据的问题。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体而言,涉及一种目标数据信息的获取方法、一种目标数据信息的获取装置、一种电子设备以及一种存储介质。


技术介绍

1、在现有的筛选专业领域数据的方法,绝大多数都是通过人工定义关键词,然后在数据文本中进行关键词匹配,将包含关键词的数据挑选出来作为领域数据集,但主要存在以下缺点:第一是人工筛选关键词有遗漏,单纯依靠数据人员主观定义关键词必然会因其阅历原因有所遗漏,从而导致在筛选数据时会漏掉很多专业领域数据;第二是在进行单纯的关键词匹配时会获取到很多嘈杂数据,例如,通过“家居”关键词可能筛选出包含“他家居住在上海”等非家居领域数据。因此,一种新型的、能更好的从通用数据获取专业领域数据的方法具有重要的应用价值。


技术实现思路

1、本专利技术旨在解决或改善上述技术问题的至少之一。

2、为此,本专利技术的第一目的在于提供一种目标数据信息的获取方法。

3、本专利技术的第二目的在于提供一种目标数据信息的获取装置。

4、本专利技术的第三目的在于提供一种电子设备。

本文档来自技高网...

【技术保护点】

1.一种目标数据信息的获取方法,其特征在于,包括:

2.根据权利要求1所述的目标数据信息的获取方法,其特征在于,所述对第一数据信息进行主题词集提取得到主题词集合的步骤,包括:

3.根据权利要求1所述的目标数据信息的获取方法,其特征在于,所述根据所述主题词集合得到所述第一数据信息所属的第一数据集合的步骤,包括:

4.根据权利要求3所述的目标数据信息的获取方法,其特征在于,所述根据所述主题词集合得到词向量集合的步骤,包括:

5.根据权利要求3所述的目标数据信息的获取方法,其特征在于,所述根据所述词向量集合得到所述词向量集合所属的第二数据集合的步...

【技术特征摘要】

1.一种目标数据信息的获取方法,其特征在于,包括:

2.根据权利要求1所述的目标数据信息的获取方法,其特征在于,所述对第一数据信息进行主题词集提取得到主题词集合的步骤,包括:

3.根据权利要求1所述的目标数据信息的获取方法,其特征在于,所述根据所述主题词集合得到所述第一数据信息所属的第一数据集合的步骤,包括:

4.根据权利要求3所述的目标数据信息的获取方法,其特征在于,所述根据所述主题词集合得到词向量集合的步骤,包括:

5.根据权利要求3所述的目标数据信息的获取方法,其特征在于,所述根据所述词向量集合得到所述词向量集合所属的第二数据集合的步骤,包括:

6.根据权利要求1至5中任一项所述的目标数据信息的获取方法,其特征在于,所述根据所述第一数据集合确定所述第一数据集合的专...

【专利技术属性】
技术研发人员:李世龙徐国粮王逸鸣杨瑞华克儒王定
申请(专利权)人:美的集团上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1