当前位置: 首页 > 专利查询>微软公司专利>正文

根据多个源进行产品合成制造技术

技术编号:8165735 阅读:176 留言:0更新日期:2013-01-08 12:28
本发明专利技术公开了将来自多个数据源的产品信息自动合成到在线目录中的方法与系统。特别地,本发明专利技术公开了基于属性—值对自动合成产品信息的方法与系统。可以通过实体提取、种子摄入以及其他机制,从具有不同分类法和模式的多个结构化和非结构化的数据源获得产品信息。还可以基于普及度数据,额外或可替代地获得或导出产品信息。可以对产品信息进行清理、分割和标准化。可以对产品信息进行聚集,把最相近的产品、属性名和属性值关联起来。可以确定属性名的代表性值,更新在线目录以使得条目对目录用户来说全面、有意义并且有用。可以安排频繁发生的每天数次根据至少5亿个不同的数据源的更新。

【技术实现步骤摘要】
【国外来华专利技术】根据多个源进行产品合成
技术介绍

技术介绍
g在提供本专利申请的基本上下文,不g在描述待解决的具体问题。非常全面的在线产品目录对电子商务的成功至关重要。面对不可胜数的产品介绍和新制造商,使产品目录保持 最新是ー项艰巨的工作。通常,在线目录通过产品供给和来自多个源的信息构建产品条目。但是,不同商家或其他源(例如评论网站、制造商列表等)可以为同一产品提供的信息或数据的不同子集。此外,不同的源可以使用不同的模式(schema)来提供它们的产品信息,呈现产品属性的方式也可以有很大差异。例如,不同的源可以使用对产品属性进行不同命名的模式(例如有的用“维度”,有的用“长度”、“宽度”和“高度”)。不同的源对属性的描述也可以不同(例如“百万像素”或“像素”)。从产品目录用户的角度看,来自各供应商的相同产品的单独产品列表并不是ー种理想的体验。类似地,仅仅把重复的概念性产品信息拼接起来也不是ー种理想的体验。来自多样、大量的数据源的信息和数据本身的很多类型、结构在填充对在线产品目录的用户而言简明、全面、有意义、有用的产品描述上提供了可怕的挑战。
技术实现思路
提供此
技术实现思路
来以简要形式介绍ー些概念选集,其将在以本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:A福西曼H阮JFdLe斯瓦S帕帕里佐斯R阿格拉瓦陈志敏LW科拉吉奥范尼P斯克奇
申请(专利权)人:微软公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1