一种获取候选项的方法及装置制造方法及图纸

技术编号:10124420 阅读:153 留言:0更新日期:2014-06-12 15:02
本申请提供了一种获取候选项的方法及装置,其中的方法具体包括:收集某地理区域内用户的输入行为数据;分析已收集的输入行为数据,得到该地理区域的分地域数据;接收用户在该地理区域的输入序列;依据该地理区域的分地域数据,获取与所述输入序列相应的候选项。本申请能够提高用户的输入效率。

【技术实现步骤摘要】
【专利摘要】本申请提供了一种获取候选项的方法及装置,其中的方法具体包括:收集某地理区域内用户的输入行为数据;分析已收集的输入行为数据,得到该地理区域的分地域数据;接收用户在该地理区域的输入序列;依据该地理区域的分地域数据,获取与所述输入序列相应的候选项。本申请能够提高用户的输入效率。【专利说明】一种获取候选项的方法及装置
本申请涉及文字输入
,特别是涉及一种获取候选项的方法及装置。
技术介绍
目前随着计算机技术以及互联网技术的普及与发展,一方面,用于实现计算机文字输入的输入法越来越深入到人们的生活中,另一方面,用户对于输入法的智能性要求也越来越高。以手机为代表的移动设备近年来发展迅猛,CPU和存储设备性能上都有大幅提高。与之相应的,移动设备上的应用也越来越丰富,用户界面也越来越友善。如果移动设备上安装的输入法能提供基于地理位置的候选项,则能够大大提高用户输入效率和操作体验。申请号为201110256454.1,专利技术名称为“便携式设备上基于地理位置动态调整候选词的系统及方法”的中国专利技术专利(以下简称为现有的技术方案的技术方案)公开了一种便携式设备上基于地理位置动态调整候选词的技术方案,相应技术方案的方法流程具体可以包括:步骤1、位置更新模块实时对便携式设备的当前地理位置进行定位,获得当前地理位置信息,并将当前地理位置信息送至引擎模块;步骤2、引擎模块接收到所述当前地理位置信息,并根据需要动态地从网络服务模块下载当前地理位置信息所对应的与地理位置相关的候选词数据;步骤3、引擎模块将下载得到的与地理位置相关的候选词数据存入字典模块;步骤4、输入模块根据用户的输入动作产生相应的输入信号,并将该输入信号送至引擎模块;步骤5、引擎模块接收到所述输入信号,在字典模块中搜索并得到对应的输入候选词信息,并将所述候选词信息送至候选词生成模块;步骤6、候选词生成模块接收到所述候选词信息,生成输入候选项列表。上述现有的技术方案的技术方案中,地图数据是其候选词数据的主要来源,地图数据中通常包括有商圈、餐饮等服务信息的名称,能够在一定程度上满足用户的输入需求,但是,地图数据具有如下局限性:一是,地图数据所覆盖的服务信息的名称有限,无法满足用户的非服务信息的名称的输入需求,如地图数据中是无法覆盖到“江南Style”、“元芳”、“Techno”这种词汇的;二是,地图数据所使用的词语通常过于正式,不能符合某些用户的口语化输入习惯,如有些用户喜欢用“新疆办”来表示“新疆驻北京办事处”等等,而“新疆办”在地图数据中是不存在的;三是,地图数据有自己的更新周期,如果地图数据的更新周期偏长,则导致上述现有的技术方案的候选词数据长期得不到更新,这样,如果某个商圈内新开了一家餐馆,则上述现有的技术方案的候选词数据不能及时获取该餐馆的相应数据;总之,上述现有的技术方案不能智能地了解用户的输入需求,不能总是在输入过程中出现用户想要的候选词,影响了用户的输入效率,这对输入法的智能性提出了更高的要求。另外,采用上述现有的技术方案的技术方案,只要实时定位的当前地理位置发生变化,就需要与网络服务模块通信以下载与新地理位置相应的候选词数据,这样,在移动设备用户频繁切换地理位置的情况下,容易给移动设备和网络服务模块之间带来频繁、大量的通信开销。还有,移动设备上字典模块中日积月累不同地理位置的候选词数据,容易占据移动设备的存储空间。总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提高用户的输入效率。
技术实现思路
本申请所要解决的技术问题是提供一种获取候选项的方法,能够提高用户的输入效率。为了解决上述问题,本申请公开了一种获取候选项的方法,包括:收集某地理区域内用户的输入行为数据;分析已收集的输入行为数据,得到该地理区域的分地域数据;接收用户在该地理区域的输入序列;依据该地理区域的分地域数据,获取与所述输入序列相应的候选项。另一方面,本申请还公开了一种获取候选项的装置,包括:数据收集单元,用于收集某地理区域内用户的输入行为数据;数据分析单元,用于分析已收集的输入行为数据,得到该地理区域的分地域数据;输入序列接收单元,用于接收用户在该地理区域的输入序列;及候选项获取单元,用于依据该地理区域的分地域数据,获取与所述输入序列相应的候选项。与现有的技术方案相比,本申请具有以下优点:本申请依据该地理区域的分地域数据,获取与用户在该地理区域的输入序列相应的候选项。首先,由于所述分地域数据是依据地理区域内用户的输入行为数据分析得到的,其来源并不局限于地图数据,故能够有效避免地图数据词语有限、词语正式、更新周期长等特点对候选项的影响;更重要的是,地理区域内用户在相同的地域环境中很有可能使用输入行为数据来表达与该地域环境相应的特征信息,而对地理区域内用户的输入行为数据进行分析所得到的分区域数据是能够体现地理区域的特色的;这样,本申请将某地理区域的分区域数据应用于该地理区域内用户的文字输入过程中候选项的获取,则能够获取得到反映该地理区域内特征或特色信息的候选项,从而有利于在文字输入过程中出现用户想要的候选项,能够提高输入法的智能性和用户的输入效率;例如,在分区域数据描述的地理区域内,用户的特征数据反映地理区域内的错误发音习惯时,本申请能够自动对错误的输入序列进行纠错处理以得到正确的候选项,故能够避免相应地理区域内用户的一系列纠错操作,提高输入效率。其次,现有的技术方案中,地理位置与候选词数据是一一对应的,一方面,存储候选词数据也需要存储相应的地理位置信息,容易占据服务器和移动设备的存储空间;另一方面,当前地理位置是实时定位的,一旦移动设备的当前地理位置发生变化,就需要与网络服务模块通信以下载与新地理位置相应的候选词数据,这容易给移动设备和网络服务模块之间带来频繁、大量的通信开销;而本申请在文字输入过程中所使用的分区域数据是针对地理区域的,其存储无需考虑具体的地理位置信息,故能够节省服务器和移动设备的存储空间;并且,即使移动设备的当前地理位置发生变化,但只要移动设备所处的地理区域不变,就可以避免与服务器通信以获取地理区域的分区域数据,故也能节省移动设备和服务器的通信开销。再者,本申请确定所述输入序列所属的地理区域不一定依赖于移动设备对于自身地理位置信息的定位,也即,即使移动设备不具有自身地理位置信息的GPS等定位功能,本申请依然能够顺利实施,故本申请具有良好的扩展性。进一步,现有的技术方案中,在便携式设备上已经加载的当前地理位置信息相关的词库很有可能是半年前或者更久前加载的,容易导致最终得到候选词信息的时效性差;并且,即使在当时从网络服务模块下载当前地理位置信息所对应的与地理位置相关的候选词数据的情况下,网络服务模块侧存储的与地理位置相关的候选词数据往往是事先生成的,仍容易影响最终得到候选词信息的时效性;而本申请中,所述分地域数据所依据的地理区域内用户的输入行为数据可以为实时收集的数据,这里的实时收集是指在确定所述输入序列所属的地理区域后进行相应地理区域内数据的收集,这样依据实时收集的数据分析得到的分区域数据也是实时的,进一步获取得到的候选项也是实时的;因此,相对于现有的技术方案,本申请所述分地域数据所依据的地理区域内用户的输入行为数据为实时收本文档来自技高网
...

【技术保护点】
一种获取候选项的方法,其特征在于,包括:收集某地理区域内用户的输入行为数据;分析已收集的输入行为数据,得到该地理区域的分地域数据;接收用户在该地理区域的输入序列;依据该地理区域的分地域数据,获取与所述输入序列相应的候选项。

【技术特征摘要】

【专利技术属性】
技术研发人员:张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1