当前位置: 首页 > 专利查询>微软公司专利>正文

用于本地字轮/WEB搜索的基于人口统计的分类制造技术

技术编号:2914216 阅读:326 留言:0更新日期:2012-04-11 18:40
提供了创建一种语言中的句子分类,并基于地理位置和/或人口统计准则进一步构造语言模型的相关联的本地版本的各种系统和方法,其中这些本地语言模型根据所选人口统计准则可以是不同的粒度水平。本发明专利技术利用形成句子分类(例如,树结构)的分类编码器组件和利用该句子分类来构造本地化语言模型的本地语言模型编码器组件。解码器组件可随后通过混合来自匹配用户人口统计的不同人口统计粒度的本地语言模型的k个最佳答案来启用本地字轮和/或本地web搜索。因此,对于在一个人口统计地点的用户的输入数据的k个最佳匹配可不同于对于在另一个地点的其他用户的相同输入的k个最佳匹配。

【技术实现步骤摘要】
【国外来华专利技术】背景计算机硬件、软件和联网方面的技术进步已提供了能够从世界上的任何地方彼此通信的高效的、节省成本的计算系统。使用这些系统来访问、浏览和搜索因特网,撰写、发送和接收电子邮件消息,查看和编辑文档,发送和获得文本消息、即时消息等。例如,用户可利用蜂窝电话、个人数字助理(PDA)来在因特网上搜索电影时间并且通过发送电子邮件、文本消息或即时消息来邀请朋友观看特定的放映。已经利用了各种技术来将信息输入到这些设备中,诸如通过使用键盘、鼠标、触敏屏幕、笔设备、光学字符识别、语音识别等来输入数据。例如,常规的系统通常利用大小可取决于主机设备类型(个人计算机还是膝上型计算机等)而变化的键盘,这些设备可利用基于QWERTY布局的键盘,其中每一字母数字字符可以与一相应的键相关联,而蜂窝电话可包括更少的键,使得多个字母字符与一数字字符共享单个键。例如,蜂窝电话键区上的“2”键通常与字母“A”、“B”和“C”相关联。此外,通常利用多种技术来用有限的键盘输入文本一但是当多于一个字母r>数字字符与一特定本文档来自技高网...

【技术保护点】
一种计算机实现的系统,包括以下计算机可执行组件: 基于人口统计将句子归纳成分类的分类编码器组件;以及 扩充所述分类以形成本地化语言模型,以便搜索本地兴趣的本地语言模型编码器组件。

【技术特征摘要】
【国外来华专利技术】US 2006-5-1 60/746,134;US 2006-11-30 11/565,2311.一种计算机实现的系统,包括以下计算机可执行组件:
基于人口统计将句子归纳成分类的分类编码器组件;以及
扩充所述分类以形成本地化语言模型,以便搜索本地兴趣的本地语言模型
编码器组件。
2.如权利要求1所述的计算机实现的系统,其特征在于,所述本地句子是
查询日志的形式。
3.如权利要求2所述的计算机实现的系统,其特征在于,所述分类是树结
构的形式以归纳查询日志。
4.如权利要求1所述的计算机实现的系统,其特征在于,还包括具有通过
本地语言模型的分类来评估输入数据以产生一组扩充的扩充组件的解码器组
件。
5.如权利要求3所述的计算机实现的系统,其特征在于,所述树结构具有
基于预定准则来提升查询的节点。
6.如权利要求5所述的计算机实现的系统,其特征在于,所述预定准则是
重要性测试准则。
7.如权利要求1所述的计算机实现的系统,其特征在于,还包括提供关于
用户地点的信息以产生与本地兴趣相关的扩充的本地上下文组件。
8.如权利要求1所述的计算机实现的系统,其特征在于,所述人口统计基
于时间和空间中的至少一个。
9.如权利要求3所述的计算机实现的系统,其特征在于,所述树结构是
Kd树结构的形式。
10.如权利要求1所述的计算机实现的系统,其特征在于,还包括接受
来自用户的输入数...

【专利技术属性】
技术研发人员:B提尔森KW丘奇
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1