【技术实现步骤摘要】
【国外来华专利技术】web文档修订的异常检测相关申请的交叉引用本国际申请要求于2016年6月21日提交的、题为“ANOMALYDETECTIONFORWEBDOCUMENTREVISION”、序列号为15/188,532的美国专利申请的优先权,其全部内容通过引用整体并入本文。
本公开一般地涉及配置到促进数字内容管理的专用机器
的机器,包括这种专用机器的计算机化变型以及对这些变型的改进,而且涉及使这种专用机器比促进数字内容管理的其他专用机器有所改进的技术。具体地,本公开提出了用于检测对已发布数字内容的异常修订的系统和方法。
技术介绍
许多在线内容发布平台允许用户在线生成并发布web文档(例如,web页面)形式的内容,其可以由其他用户使用web浏览器或应用来浏览。通常在发布时或之前为每个发布的web文档分配统一资源标识符(URI)。通常,这些在线内容发布平台允许用户甚至在发布内容后修订内容。虽然可以更新web文档的某些内容,但URI通常保持不变。在一些情况下,允许对web文档进行修订同时保持相同的URI,对于在线内容发布平台来说可能是有问题的。在一个示例中,内容发布平台是一种在线市场,其允许用户以产品列表项的形式创建内容,以将他们供销售的产品提供给其他用户。在线市场的用户可以最初为高需求的第一产品创建产品列表项,然后在线市场可以为该产品列表项分配URI。然后,用户可以完全修订产品列表项以覆盖具有较低需求和期望的第二产品,而分配给该产品列表项的URI将保持相同,尽管URI仍然可以与高需求的第一产品的库存和历史销售相关联。通过这种方式,用户可以利用在线市场的修订能力来操纵非期望 ...
【技术保护点】
1.一种系统,包括:一个或多个处理器;存储指令的计算机可读介质,所述指令在由所述一个或多个处理器执行时使所述系统执行包括以下各项的操作:访问发布的web文档,所述发布的web文档包括使用从用户的计算设备接收的数据生成的多个不同元素;访问更新的web文档,所述更新的web文档基于用户使用在用户的计算设备上呈现的界面对所述发布的web文档做出的一个或多个修改,所述更新的web文档包括至少一个用户生成的对所述发布的web文档的所述多个不同元素中的元素的修改;基于所述更新的web文档与所述发布的web文档的比较生成一个或多个异常分数,所述一个或多个异常分数提供所述更新的web文档与所述发布的web文档的偏差的度量;以及基于所述异常分数与阈值异常分数的比较结果来确定是否允许发布所述更新的web文档。
【技术特征摘要】
【国外来华专利技术】2016.06.21 US 15/188,5321.一种系统,包括:一个或多个处理器;存储指令的计算机可读介质,所述指令在由所述一个或多个处理器执行时使所述系统执行包括以下各项的操作:访问发布的web文档,所述发布的web文档包括使用从用户的计算设备接收的数据生成的多个不同元素;访问更新的web文档,所述更新的web文档基于用户使用在用户的计算设备上呈现的界面对所述发布的web文档做出的一个或多个修改,所述更新的web文档包括至少一个用户生成的对所述发布的web文档的所述多个不同元素中的元素的修改;基于所述更新的web文档与所述发布的web文档的比较生成一个或多个异常分数,所述一个或多个异常分数提供所述更新的web文档与所述发布的web文档的偏差的度量;以及基于所述异常分数与阈值异常分数的比较结果来确定是否允许发布所述更新的web文档。2.根据权利要求1所述的系统,其中,所述发布的web文档的所述多个不同元素包括文本、图像和数值。3.根据权利要求1所述的系统,其中,生成所述一个或多个异常分数包括:执行所述更新的web文档中包括的更新文本与所述发布的web文档中包括的发布文本的比较;以及基于所述比较生成文本匹配分数,所述文本匹配分数提供所述更新文本与所述发布文本之间的相似性的度量,其中所述一个或多个异常分数包括所述文本匹配分数。4.根据权利要求3所述的系统,其中,执行所述比较包括使用余弦相似性算法来确定所述更新文本与所述发布文本之间的相似性。5.根据权利要求1所述的系统,其中,生成所述一个或多个异常分数包括:执行所述发布的web文档中包括的发布图像与所述更新的web文档中包括的更新图像的比较;以及基于所述比较生成图像相似性分数,所述图像相似性分数提供所述发布图像和所述更新图像之间的相似性的度量,其中所述一个或多个异常分数包括所述图像相似性分数。6.根据权利要求5所述的系统,其中,执行所述比较包括:基于所述发布图像提取第一组特征描述符;将第一组特征描述符存储在对应于所述发布图像的第一矩阵中;基于所述更新图像提取第二组特征描述符;将第二组特征描述符存储在对应于所述更新图像的第二矩阵中;以及比较所述第一矩阵和所述第二矩阵;其中生成所述图像相似性分数基于所述第一矩阵与所述第二矩阵的比较。7.根据权利要求1所述的系统,其中,生成所述一个或多个异常分数包括基于所述更新的web文档中包括的更新数值与和所述web文档相关联的数值的平均值之间的差异来生成数值偏差分数;以及所述一个或多个异常分数包括所述数值偏差分数。8.根据权利要求1所述的系统,其中,生成所述一个或多个异常分数包括:基于所述更新的web文档中包括的更新文本与所述发布的web文档中包括的发布文本的比较,生成文本匹配分数;基于所述更新的web文档中包括的更新图像与所述发布的web页面中包括的发布图像的比较,生成图像相似性分数;基于所述更新的web文档中包括的更新数值与和所述web文档相关联的数值的平均值之间的差异,生成数值偏差分数;以及将所述文本匹配分数、所述图像相似性分数和所述数值偏差分数聚合,以生成所述异常分数。9.根据权利要求1所述的系统,其中,基于所述异常分数与所述阈值异常分数的比较结果确定是否允许发布所述更新的web文档包括:响应于所述异常分数越过所述阈值异常分数,阻止发布所述更新的web文档。10.根据权利要求9所述的系统,还包括:将所述更新的web文档发送给管理员的设备,以便管理员进行人工审查;以及基于管理员的人工审查结果来改进所述一个或多个阈值异常分数。11.根据权利要求1所述的系统,还包括:从管理计算机系统接收作为人工审查结果的对所述更新的web文档的批准,其中,改进所述阈值异常分数包括基于作为人工审查结果的对所述更新的web文档的批准来增加所述阈值异常分数。12.根据权利要求9所述的系统,还包括:生成指示所述更新的web文档...
【专利技术属性】
技术研发人员:拉克希米·纳拉辛汉,希曼休·贾殷,
申请(专利权)人:电子湾有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。