外贸撮合的采购商信息采集方法、装置、设备及存储介质制造方法及图纸

技术编号:22002006 阅读:22 留言:0更新日期:2019-08-31 05:53
本发明专利技术提供了一种基于外贸撮合的采购商信息采集方法、装置、设备,属于信息采集技术领域。它解决了现有采购商信息不准确等问题。本外贸撮合的采购商信息采集方法,包括以下步骤:S1:信息收集;S2:信息辨认;S3:信息完善;S4:信息验真;S5:采购商形像生成。本发明专利技术具有信息准确等优点。

Purchaser Information Collection Method, Equipment, Equipment and Storage Medium for Foreign Trade Matching

【技术实现步骤摘要】
外贸撮合的采购商信息采集方法、装置、设备及存储介质
本专利技术属于信息采集
,特别涉及一种基于外贸撮合的采购商信息采集方法、装置、设备。
技术介绍
当前外贸撮合场景下采购商信息采集主要基于国外的黄页和分类目录、B2B平台、海运提单数据、采集网址和email的爬虫软件等方式进行。使用国外的黄页和分类目录的,可以手工复制,也可以用爬虫技术来采集,将采购商信息写入到自己的数据表或数据库中。这类信息往往已过期,并且很少会有采购哪类商品的情报,需要在大量数据中去找出真实的信息,并结合其它数据来判断他具体采购的商品。使用B2B平台的,依赖于具体B2B平台的能力,实际获取的采购商信息可能不及时,数据量不多,虚假采购商难于辨认。使用海运提单数据的,海运提单数据有时间上的连续性,但不是所有的海运提单数据都有联系信息,而且海运提单数据中有些是有采购商名称的,有些则不是采购商,例如货代公司,其商品信息需要通过各国不同标准的海关编码辨识,或从商品的型号参数信息中的提炼,难度较大。使用爬虫软件采集网址和email的,可选择面非常广,数据有效性和对口性无法保证,会浪费大量的时间和精力。
技术实现思路
本专利技术的目的是针对现有技术中存在的上述问题,提供了一种能够提供有效信息的基于外贸撮合场景的采购商信息采集方法、装置、设备。本专利技术的第一个目的可通过下列技术方案来实现:一种外贸撮合的采购商信息采集方法,其特征在于,包括以下步骤:S1:信息收集:收集录入中采购商的采购商相关信息,将采购商相关信息分为采购商实体信息、采购商经营信息、采购商联系信息;S2:信息辨认:根据采购商联系信息识别出信息要素,将信息要素填入预设有统一格式的类目中,并将各信息要素按可信、半可信、不可信依次分出等级,其中验证正确的信息要素为可信,验证错误的信息要素为不可信,无法验证的信息要素为半可信;S3:信息完善:未填有可信或半可信的类目为缺失信息,搜集与录入中采购商相关联的已录入采购商,从已录入采购商的采购商相关信息中匹配缺失信息,并补入匹配完成的缺失信息;S4:信息验真:验证半可信或不可信的采购商相关信息;S5:采购商形像生成:提取可信的采购商相关信息,生成采购商的数据形像。本专利技术的工作原理:服务器通过网络首先收集采购商的相关信息,将收集的信息进行辨认、分级,将缺失的信息完善,将半可信的信息进行验真,最后生成采购商形像。由于采购商的信息经过层层的收集和确认,使得最后得出的采购商形像中生成的信息的精确度较高,方便人们对采购商有效信息的获取。在上述的外贸撮合的采购商信息采集方法中,还包括步骤S6:信息过期:设置过期时间,采购商联系信息超过期时间后未更新的,降低采购商相关信息的等级,并分别执行步骤S3或步骤S4。在上述的外贸撮合的采购商信息采集方法中,所述的步骤S1中包括以下信息收集方法,通过采购商所在国的政府官方渠着收集有工商信息编号的采购商相关信息,包括企业名称、注册地址、营业状态中的一种或几种;通过采购商所在国及国际上的行业协会渠道收集采购商信息;通过爬虫程序收集采购商所在国招聘类信息;通过爬虫程序收集采购商所在图海关进出口数据;通过爬虫程序收集采购商参加所在国展会的观众信息;通过爬虫程序收集包含采购商信息的分类网站或黄页网站数据。在上述的外贸撮合的采购商信息采集方法中,所述的步骤1中还包括以下信息收集方法,设置问卷供采购商主动填写采购商相关信息。在上述的外贸撮合的采购商信息采集方法中,在所述的步骤S3和步骤S4中,均还能通过在采购商所在国预设有的采购中心收集采购商相关信息。在上述的外贸撮合的采购商信息采集方法中,在所述的步骤S3和步骤S4中,均还能通过在采购商所在国或语言相通国预设有的呼叫中心收集采购商相关信息。在上述的外贸撮合的采购商信息采集方法中,所述的步骤S2中,识别出的信息要素至少包括电话号码或邮箱地址,电话号码的验证方法包括以下步骤:根据预设的电话号码统一格式验证号码本身是否有错误,电话号码的统一格式包括国际区号、所在国地区号、拨号方式,若电话号码本身错误则该电话号码的等级为不可信;邮箱地址的验证方法包括以下步骤:根据邮箱地址通用规范验证邮箱地址本身是否错误,根据domainDNS验证邮箱地址是否有效,根据SMTP验证邮箱地址是否有效,根据账号有效性测试验证邮箱地址是否存在,上述邮箱地址的验证方法中的任意步骤验证失败则该邮箱地址的等级为不可信。本专利技术的第二个目的可通过下列技术方案来实现:一种外贸撮合的采购商信息采集装置,其特征在于,包括:用于信息收集装置:收集录入中采购商的采购商相关信息,将采购商相关信息分为采购商实体信息、采购商经营信息、采购商联系信息;用于信息辨认的装置:根据采购商联系信息识别出信息要素,将信息要素填入预设有统一格式的类目中,并将各信息要素按可信、半可信、不可信依次分出等级,其中验证正确的信息要素为可信,验证错误的信息要素为不可信,无法验证的信息要素为半可信;用于信息完善的装置:未填有可信或半可信的类目为缺失信息,搜集与录入中采购商相关联的已录入采购商,从已录入采购商的采购商相关信息中匹配缺失信息,并补入匹配完成的缺失信息;用于信息验真的装置:验证半可信或不可信的采购商相关信息;用于采购商形像生成的装置:提取可信的采购商相关信息,生成采购商的数据形像。在上述的外贸撮合的采购商信息采集装置中,还包括:用于判断信息过期的装置:设置过期时间,采购商联系信息超过期时间后未更新的,降低采购商相关信息的等级。在上述的外贸撮合的采购商信息采集装置中,所述的用于信息收集装置中包括以下信息收集方法,通过采购商所在国的政府官方渠着收集有工商信息编号的采购商相关信息,包括企业名称、注册地址、营业状态中的一种或几种;通过采购商所在国及国际上的行业协会渠道收集采购商信息;通过爬虫程序收集采购商所在国招聘类信息;通过爬虫程序收集采购商所在图海关进出口数据;通过爬虫程序收集采购商参加所在国展会的观众信息;通过爬虫程序收集包含采购商信息的分类网站或黄页网站数据。在上述的外贸撮合的采购商信息采集装置中,所述的用于信息收集装置中还包括以下信息收集方法,设置问卷供采购商主动填写采购商相关信息。在上述的外贸撮合的采购商信息采集装置中,在所述的用于信息完善的装置和用于信息验真的装置中,均还能通过在采购商所在国预设有的采购中心收集采购商相关信息。在上述的外贸撮合的采购商信息采集装置中,在所述的用于信息完善的装置和用于信息验真的装置中,均还能通过在采购商所在国或语言相通国预设有的呼叫中心收集采购商相关信息。在上述的外贸撮合的采购商信息采集装置中,所述的用于信息辨认的装置中,识别出的信息要素至少包括电话号码或邮箱地址,电话号码的验证方法包括以下步骤:根据预设的电话号码统一格式验证号码本身是否有错误,电话号码的统一格式包括国际区号、所在国地区号、拨号方式,若电话号码本身错误则该电话号码的等级为不可信;邮箱地址的验证方法包括以下步骤:根据邮箱地址通用规范验证邮箱地址本身是否错误,根据domainDNS验证邮箱地址是否有效,根据SMTP验证邮箱地址是否有效,根据账号有效性测试验证邮箱地址是否存在,上述邮箱地址的验证方法中的任意步骤验证失败则该邮箱地址的等级为不可信。本专利技术的第本文档来自技高网...

【技术保护点】
1.一种外贸撮合的采购商信息采集方法,其特征在于,包括以下步骤:S1:信息收集:收集录入中采购商的采购商相关信息,将采购商相关信息分为采购商实体信息、采购商经营信息、采购商联系信息;S2:信息辨认:根据采购商联系信息识别出信息要素,将信息要素填入预设有统一格式的类目中,并将各信息要素按可信、半可信、不可信依次分出等级,其中验证正确的信息要素为可信,验证错误的信息要素为不可信,无法验证的信息要素为半可信;S3:信息完善:未填有可信或半可信的类目为缺失信息,搜集与录入中采购商相关联的已录入采购商,从已录入采购商的采购商相关信息中匹配缺失信息,并补入匹配完成的缺失信息;S4:信息验真:验证半可信或不可信的采购商相关信息;S5:采购商形像生成:提取可信的采购商相关信息,生成采购商的数据形像。

【技术特征摘要】
1.一种外贸撮合的采购商信息采集方法,其特征在于,包括以下步骤:S1:信息收集:收集录入中采购商的采购商相关信息,将采购商相关信息分为采购商实体信息、采购商经营信息、采购商联系信息;S2:信息辨认:根据采购商联系信息识别出信息要素,将信息要素填入预设有统一格式的类目中,并将各信息要素按可信、半可信、不可信依次分出等级,其中验证正确的信息要素为可信,验证错误的信息要素为不可信,无法验证的信息要素为半可信;S3:信息完善:未填有可信或半可信的类目为缺失信息,搜集与录入中采购商相关联的已录入采购商,从已录入采购商的采购商相关信息中匹配缺失信息,并补入匹配完成的缺失信息;S4:信息验真:验证半可信或不可信的采购商相关信息;S5:采购商形像生成:提取可信的采购商相关信息,生成采购商的数据形像。2.根据权利要求1所述的一种外贸撮合的采购商信息采集方法,还包括步骤S6:信息过期:设置过期时间,采购商联系信息超过期时间后未更新的,降低采购商相关信息的等级,并分别执行步骤S3或步骤S4。3.根据权利要求1所述的一种外贸撮合的采购商信息采集方法,其特征在于,所述的步骤S1中包括以下信息收集方法,通过采购商所在国的政府官方渠着收集有工商信息编号的采购商相关信息,包括企业名称、注册地址、营业状态中的一种或几种;通过采购商所在国及国际上的行业协会渠道收集采购商信息;通过爬虫程序收集采购商所在国招聘类信息;通过爬虫程序收集采购商所在图海关进出口数据;通过爬虫程序收集采购商参加所在国展会的观众信息;通过爬虫程序收集包含采购商信息的分类网站或黄页网站数据。4.根据权利要求1所述的一种外贸撮合的采购商信息采集方法,其特征在于,所述的步骤1中还包括以下信息收集方法,设置问卷供采购商主动填写采购商相关信息。5.根据权利要求1所述的一种外贸撮合的采购商信息采集方法,其特征在于,在所述的步骤S3和步骤S4中,均还能通过在采购商所在国预设有的采购中心收集采购商相关信息。6.根据权利要求1所述的一种外贸撮合的采购商信息采集方法,其特征在于,在所述的步骤S3和步骤S4中,均还能通过在采购商所在国...

【专利技术属性】
技术研发人员:潘建军方欢胜王檬王栏钦田林杰陈佳琰
申请(专利权)人:浙江米奥兰特商务会展股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1