一种企业的产品信息采集方法、采集系统及存储介质技术方案

技术编号:42119521 阅读:22 留言:0更新日期:2024-07-25 00:38
本发明专利技术属于信息采集技术领域,尤其涉及一种企业的产品信息采集方法、采集系统及存储介质。产品信息采集方法包括:S1,获取包含目标企业的页面源码数据;S2,解析和清洗页面源码数据后,形成对应的标准数据并存储于第一数据库中;S3,从第一数据库中抽取若干条标准数据进行人工标注后构建训练集,并使用训练集对产品信息采集模块进行预训练;S4,使用预训练好的产品信息采集模块基于第一数据库中的标准数据进行目标企业的产品信息采集,并将目标企业的产品信息存储于第二数据库内。本发明专利技术可以对高效且准确地采集企业的产品信息,降低采集过程中的人工成本。

【技术实现步骤摘要】

本专利技术属于信息采集,尤其涉及一种企业的产品信息采集方法、采集系统及存储介质


技术介绍

1、随着社会和信息技术的快速发展,在一个企业的运行中,无论是进行市场规划时罗列竞品,还是采购企业必须的消耗品时,都越来越倾向于通过网络这个庞大的数据源去获取产品信息。

2、现有技术中通常是人工通过关键词检索后,在检索结果中通过人工提炼出所需的产品信息。

3、但是关键词检索只能滤掉一部分完全不相关的信息,但检索结果依然庞大,受不同搜索引擎的限制,有的检索结果并不是按照相关性的降序进行展示的,这就会影响后续人工提炼的效率,耗时费力。并且,检索结果的数据结构和呈现方式复杂,不仅包括企业官网的公司简介、财经新闻,还包括购物网页的产品介绍等,这会进一步降低人工提炼的效率。人工提炼的准确性与完整性还受个人因素影响,所以亟需一种可以高效且准确地从网络数据源中获取产品信息的方法。


技术实现思路

1、本专利技术的目的是克服上述现有技术的不足,提供一种企业的产品信息采集方法,高效且准确地从网络数据源中获取产品信息,本文档来自技高网...

【技术保护点】

1.一种企业的产品信息采集方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种企业的产品信息采集方法,其特征在于,S1中具体还包括以下子步骤:

3.根据权利要求2所述的一种企业的产品信息采集方法,其特征在于,在S13后还包括S14:

4.根据权利要求1所述的一种企业的产品信息采集方法,其特征在于,S2中具体还包括以下子步骤:

5.根据权利要求4所述的一种企业的产品信息采集方法,其特征在于,S3中具体还包括以下子步骤:

6.根权利要求5所述的一种企业的产品信息采集方法,其特征在于,在S33中还包括以下子步骤:

...

【技术特征摘要】

1.一种企业的产品信息采集方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种企业的产品信息采集方法,其特征在于,s1中具体还包括以下子步骤:

3.根据权利要求2所述的一种企业的产品信息采集方法,其特征在于,在s13后还包括s14:

4.根据权利要求1所述的一种企业的产品信息采集方法,其特征在于,s2中具体还包括以下子步骤:

5.根据权利要求4所述的一种企业的产品信息采集方法,其特征在于,s3中具体还包括以下子步骤:

6.根权利要求5所述的一种企业的产品信息采...

【专利技术属性】
技术研发人员:王建王涛王佐成吕孝忠李浩
申请(专利权)人:数据空间研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1