【技术实现步骤摘要】
【国外来华专利技术】用于收集与网络化环境中的欺诈性内容相关联的数据的系统和方法相关申请本申请要求2016年12月30日提交的美国临时专利申请62/440,798的优先权,其通过引用而全文并入于此。
技术介绍
通过诸如因特网等的网络化环境可访问大量数字内容。该内容分散在多个数据通道和/或源上,并且每天可获得越来越多的内容。虽然该内容中的大部分是合法的,但其中一些内容是欺诈性的或伪造的。
技术实现思路
根据本专利技术的实施例,提供了一种用于收集、解析和分析网络化内容中的项目标识符以识别欺诈性内容的系统。所述系统包括通信连接至网络化环境中的数据源的计算系统。所述数据源包括被配置为托管内容的一个或多个远程服务器。所述系统还包括被设置在所述计算系统中的一个或多个本地服务器。所述一个或多个本地服务器被编程为基于至少一个第一项目标识符来对所述网络化环境中的一个或多个远程服务器所托管的内容进行搜索。所述一个或多个本地服务器还被编程为响应于对所述内容的搜索而接收搜索结果集,其中各搜索结果与所述内容中识别出的项目相关联。所述一个或多个本地服务器还被编程为收集来自所述数据源的所述搜索结果集。所述一个或多个本地服务器还被编程为从所述搜索结果集中的各搜索结果提取多个项目标识符。所述多个项目标识符针对各搜索结果至少包括GTIN和品牌名称。所述一个或多个本地服务器还被编程为针对所述搜索结果集中的各搜索结果基于所述品牌名称来分析所述GTIN是合法的还是欺诈性的。所述一个或多个本地服务器还被编程为基于所述分析来将所述搜索结果集中的各搜索结果标记为合法的或欺诈性的。根据本专利技术的实施例,提供了一种用于收集、解析和分析网 ...
【技术保护点】
1.一种用于收集、解析和分析网络化内容中的项目标识符以识别欺诈性内容的系统,所述系统包括:计算系统,其通信连接至网络化环境中的数据源,所述数据源包括被配置为托管内容的一个或多个远程服务器;一个或多个本地服务器,其被设置在所述计算系统中,所述一个或多个本地服务器被编程为:基于至少一个第一项目标识符来对所述网络化环境中的一个或多个远程服务器所托管的内容进行搜索;响应于对所述内容的搜索而接收搜索结果集,其中各搜索结果与所述内容中识别出的项目相关联;收集来自所述数据源的所述搜索结果集;从所述搜索结果集中的各搜索结果提取多个项目标识符,所述多个项目标识符针对各搜索结果至少包括全球贸易项目编号和品牌名称,全球贸易项目编号即GTIN;针对所述搜索结果集中的各搜索结果,基于所述品牌名称来分析所述GTIN是合法的还是欺诈性的;以及基于所述分析来将所述搜索结果集中的各搜索结果标记为合法的或欺诈性的。
【技术特征摘要】
【国外来华专利技术】2016.12.30 US 62/440,7981.一种用于收集、解析和分析网络化内容中的项目标识符以识别欺诈性内容的系统,所述系统包括:计算系统,其通信连接至网络化环境中的数据源,所述数据源包括被配置为托管内容的一个或多个远程服务器;一个或多个本地服务器,其被设置在所述计算系统中,所述一个或多个本地服务器被编程为:基于至少一个第一项目标识符来对所述网络化环境中的一个或多个远程服务器所托管的内容进行搜索;响应于对所述内容的搜索而接收搜索结果集,其中各搜索结果与所述内容中识别出的项目相关联;收集来自所述数据源的所述搜索结果集;从所述搜索结果集中的各搜索结果提取多个项目标识符,所述多个项目标识符针对各搜索结果至少包括全球贸易项目编号和品牌名称,全球贸易项目编号即GTIN;针对所述搜索结果集中的各搜索结果,基于所述品牌名称来分析所述GTIN是合法的还是欺诈性的;以及基于所述分析来将所述搜索结果集中的各搜索结果标记为合法的或欺诈性的。2.根据权利要求1所述的系统,其中,所述一个或多个本地服务器还被编程为通过以下至少之一、基于所述品牌名称来分析所述GTIN是合法的还是欺诈性的:对所述GTIN中所包括的GS1公司前缀进行搜索,GS1即全球统一标识系统;对GS1全球电子厂商资讯注册表进行搜索;经由实体的应用编程接口即API来对该实体的数据库进行搜索;或者对品牌GTIN的独立数据库进行搜索。3.根据权利要求1所述的系统,其中,所述一个或多个本地服务器还被编程为:针对所述搜索结果中的第一搜索结果,判断所述多个项目标识符中的相应项目标识符是否与同所述搜索结果中的该第一搜索结果内所包括的品牌名称相关联的一个或多个预定义项目标识符相对应;以及基于所述多个项目标识符中的所述相应项目标识符是否与所述一个或多个预定义项目标识符相对应来将所述搜索结果中的该第一搜索结果标记为合法的或欺诈性的。4.根据权利要求1所述的系统,其中,所述一个或多个本地服务器还被编程为:分析各搜索结果的所述多个项目标识符,以识别不正确的项目标识符;以及响应于识别出所述不正确的项目标识符而将所述搜索结果标记为欺诈性的。5.根据权利要求1所述的系统,其中,所述一个或多个本地服务器还被编程为通过对网站和应用的直接搜索、查询构造、以及对所述网站的目录结构的利用来从所述数据源收集产品列表。6.根据权利要求1所述的系统,其中,所述网络化环境中的一个或多个远程服务器是web服务器,以及所述一个或多个远程服务器所托管的内容是包括网页的网站。7.根据权利要求1所述的系统,其中,所述一个或多个本地服务器还被编程为发起对与被标记为欺诈性的一个或多个结果相关联的内容的移除。8.根据权利要求1所述的系统,其中,所述一个或多个本地服务器还被编程为:响应于从所述搜索结果集中的各搜索结果提取所述多个项目标识符而针对所述搜索结果集在数据库中创建多个记录,所述数据库中所创建的多个记录中的各记录与所述搜索结果集中的结果相对应;以及将从各结果提取的多个项目标识符存储在所述数据库中所创建的多个记录中的相应记录中。9.根据权利要求8所述的系统,所述系统还包括用户界面,所述用户界面被配置为显示所述多个记录和所述多个项目标识符。10.一种用于收集、解析和分析网络化内容中的项目标识符以识别欺诈性内容的方法,所述方法经由通信连接至网络化环境中的数据源的计算系统而实现,所述数据源包括被配置为托管内容的一个或多个远程服务器,以及一个或多个本地服务器被设置在所述计算系统中,所述方法包括:通过所述一个或多个本地服务器基于至少一个第一项目标识符来对所述网络化环境中的一个或多个远程服务器所托管的内容进行搜索;通过所述一个或多个本地服务器、响应于对所述内容的搜索而接收搜索结果集,其中各搜索结果与所述内容中识别出的项目相关联;通过所述一个或多个本地服务器收集来自所述数据源的所述搜索结果集;通过所述一个或多个本地服务器从所述搜索结果集中的各搜索结果提取多个项目标识符,所述多个项目标识符针对各搜索结果至少包括全球贸易项目编号和品牌名称,全球贸易项目编号即GTIN;通过所述一个或多个本地服务器、针对所述搜索结果集中的各搜索结果、基于所述品牌名称来分析所述GTIN是合法的还是欺诈性的;以及通过所述一个或多个本地服务器基于所述分析来将所述搜索结果集中的各搜索结果标记为合法的或欺诈性的。11.根据权利要求10所述的方法,还包括通过所述一个或多个本地服务器通过以下至少之一、基于所述品牌名称来分析所述GTIN是合法的还是欺诈性的:对所述GTIN中所包括的GS1公司前缀进行搜索,GS1即全球统一标识系统;对GS1全球电子厂商资讯注册表进行搜索;经由实体的应用编程接口即API来对该实体的数据库进行搜索;或者对品牌GTIN的独立数据库进行搜索。12.根据权利要求10所述的方法,还包括:通过所述一个或多个本地服务器,针对所述搜索结果中的第一搜索结果判断所述多个项目标识符中的相应项目标识符是否与同所述搜索结果中的该第一搜索结果内所包括的品牌名称相关联的一个或多个预定义项目标识符相对应;以及通过所述一个或多个本地服务器,基于所述多个项目标识符中的所述相应项目标识符是否与所述一个...
【专利技术属性】
技术研发人员:M·V·詹金斯,
申请(专利权)人:英国卡米洛要约公司,
类型:发明
国别省市:英国,GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。