【技术实现步骤摘要】
【国外来华专利技术】使用语义含义向量的跨语言搜索相关申请的交叉引用本申请要求于2016年6月10日提交的美国专利申请No.15/179,314的优先权,其要求于2015年12月21日提交的美国临时专利申请No.62/270,489、2016年2月11日提交的美国临时专利申请No.62/293,922以及2016年2月11日提交的美国临时专利申请No.62/294,060的优先权。这些申请通过引用整体并入本文。
本公开的实施例总体上涉及跨语言在线搜索,并且更具体地,但非限制性地涉及改进用于跨界搜索用途的实时机器翻译。
技术介绍
电子和数字设备技术的兴起迅速改变了社会与媒体进行交互以及消费商品和服务的方式。数字技术使人们能够跨越国界和洲界迅速有效地相互联系。然而,尽管容易进行联系,但语言差异经常妨碍用户有效地交往。一个这样的领域是搜索和商务领域。语言障碍的一个解决方案是针对通信、搜索、产品列表等的自动机器翻译。但是,这样的翻译需要大量资源,并且翻译结果往往较差。附图说明各个所附附图仅示出了本公开示例实施例,并且不可以被认为限制其范围。图1是示出了根据一些示例实施例的包括基于网络的商务系统的各个功能组件的客户端-服务器系统环境的网络图。图2是进一步示出了根据一些示例实施例的客户端系统的框图。图3是进一步示出了根据一些示例实施例的基于网络的商务系统的框图。图4是示出了根据一些示例实施例的多语言搜索系统的框图。图5是示出了根据一些示例实施例的用于使用语义含义向量来执行单步搜索和翻译的方法的流程图。图6A-图6C是示出了根据一些示例实施例的用于使用语义含义向量来执行单步搜索和翻译的方法的 ...
【技术保护点】
1.一种方法,包括:从客户端系统接收第一语言的搜索查询;生成与所述搜索查询相关联的语义含义向量;访问与多个项目记录相关联的多个语义含义向量,其中,项目记录中的至少一些不是以第一语言编写的;对于与项目记录相关联的每个相应的语义含义向量:将所述相应的语义含义向量和与所述搜索查询相关联的语义含义向量相比较;以及基于与项目记录相关联的语义含义向量和与所述搜索查询相关联的语义含义向量之间的比较,选择一个或多个项目记录;对于所选择的每个相应的项目记录:确定相应的项目记录是否以第一语言编写;以及根据相应的项目记录没有以第一语言编写的确定,自动地将相应的项目记录翻译为第一语言;以及将一个或多个所选择的项目记录发送到客户端系统以供显示。
【技术特征摘要】
【国外来华专利技术】2015.12.21 US 62/270,489;2016.02.11 US 62/293,922;1.一种方法,包括:从客户端系统接收第一语言的搜索查询;生成与所述搜索查询相关联的语义含义向量;访问与多个项目记录相关联的多个语义含义向量,其中,项目记录中的至少一些不是以第一语言编写的;对于与项目记录相关联的每个相应的语义含义向量:将所述相应的语义含义向量和与所述搜索查询相关联的语义含义向量相比较;以及基于与项目记录相关联的语义含义向量和与所述搜索查询相关联的语义含义向量之间的比较,选择一个或多个项目记录;对于所选择的每个相应的项目记录:确定相应的项目记录是否以第一语言编写;以及根据相应的项目记录没有以第一语言编写的确定,自动地将相应的项目记录翻译为第一语言;以及将一个或多个所选择的项目记录发送到客户端系统以供显示。2.根据权利要求1所述的方法,其中,所述项目记录以多种不同的语言编写。3.根据权利要求1所述的方法,还包括:接收项目记录,以供包含在基于网络的商务系统中;生成接收到的项目记录的语义含义向量;以及将语义含义向量存储在基于网络的商务系统处的数据库中。4.根据权利要求3所述的方法,其中,存储语义含义向量还包括:分析与语义含义向量相关联的项目记录以识别与语义含义向量相关联的产品类别;以及组织数据库,使得每个语义含义向量与确定的产品类别相关联。5.根据权利要求1所述的方法,其中,将所述相应的语义含义向量和与所述搜索查询相关联的语义含义向量相比较还包括:计算与所述搜索查询相关联的语义含义向量和所述相应的语义含义向量之间的接近度得分。6.根据权利要求5所述的方法,还包括基于计算出的接近度得分对所述多个语义含义向量进行排序。7.根据权利要求6所述的方法,其中,至少部分地基于与每个语义含义向量相关联的排序来选择一个或多个项目记录。8.根据权利要求4所述的方法,其中,访问与多个项目记录相关联的多个语义含义向量还包括:分析所述搜索查询以识别与所述搜索查询相关联的一个或多个产品类别;以及访问与识别出的一个或多个产品类别相关联的语义含义向量。9.根据权利要求1所述的方法,其中,生成与所述搜索查询相关联的语义含义向量还包括:识别与所述搜索查询相关联的第一语言;选择与识别出的第一语言相关联的语义含义向量生成模型;以及使用所选择的语义含义向量生成模型来生成所述搜索查询的语义含义向量。10.一种系统,包括:一个或多个处理器;存储器;以及存储在所述存储器中的一个或多个程序,所述一个或多个程序用于由所述一个或多个处理器执行以进行:从客户端系统接收第一语言的搜索查询;生成与所述搜索查询相关联的语义含义向量;访问与多个项目记录相关联的多个语义含义向量,其中,项目记录中的至少一些不是以第一语言编写的;对于与项目记录相关联的每个相应的语义含义向量:将所述相应的语义含义向量和与所述搜索查询相关联的语义含义向量相比较;以及基于与项目记录相关联的语义含义向量和与所述搜...
【专利技术属性】
技术研发人员:塞尔秋克·科普鲁,刘明宽,叶夫根厄·马图索夫,哈桑·沙瓦夫,
申请(专利权)人:电子湾有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。