The invention discloses an information processing method, the method includes determining a user input request, the input request carrying the first search term; judging whether the first word in the first font retrieval unit second font unit is in the first vocabulary preset; if the unit in which there are second fonts the first vocabulary in the first font unit, according to the second font unit and the first term to determine the first retrieval set, the first retrieval set includes at least a first term and by the second unit and third unit font font consisting of search words, second font unit wherein the font unit comprises third the first word in the retrieval of the first font unit outside the font unit and other font unit; the first retrieval set in each Retrieval words are retrieved, retrieval results are obtained, and the retrieval results are processed. The invention also discloses an information processing device.
【技术实现步骤摘要】
一种信息处理方法及装置
本专利技术涉及信息处理技术,尤其涉及一种信息处理方法及装置。
技术介绍
个人融合通信黄页功能,是将传统黄页搬到融合通信手机上或融合通信应用(APP,Application)中,利用手机为载体,发行、传播、应用的电话号码簿功能,使用户通过一个入口,既可以检索手机联系人信息,又可以检索网上黄页的信息。检索的功能类似于百度、谷歌的搜索引擎,只是这种号码垂直搜索引擎是以手机本身为入口,随时随地拿起手机,便可轻松查询企业的基本信息或服务介绍。如何理解用户输入的真实需求,是搜索引擎要解决的核心问题之一。但是移动互联网时代,用户通过手机屏幕进行文字输入时,会受到屏幕尺寸、触摸灵敏度、用户输入的熟练程度等影响,而导致输入错误的信息。尤其对于采用手写输入的用户,更加容易输入字形相近但意义截然不同的信息,比如“已”和“己”、“鸟”和“乌”、“龙”和“尤”等。如果搜索引擎不能识别这种非主观意识造成的输入错误,那么搜索结果会千差万别,让用户无法更快更准的找到相应的信息。现有搜索引擎的常用做法有两种:1)提示用户“您是不是要搜索XX”;2)通过建议提示用户可能的输入。但这样都会增加用户的操作步骤和学习成本。如果能从根源上理解用户的需求,直接帮用户避免这样的错误,会提升用户使用的体验。因此,如何有效的建立纠错词库是亟需解决的关键问题。业界还没有完全公开免费的电子版纠错词库直接应用于搜索引擎。目前业界有如下几种解决方案:1、首先分别计算两个汉字的笔划总数,如果两个汉字的笔划总数相差大于某一数量,则认为两个汉字不是形近字;如果笔划总数相差小于或等于上述某一数量,则 ...
【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:确定用户的输入请求,所述输入请求携带有第一检索词,所述第一检索词包括一个以及一个以上的字体单元;判断所述第一检索词中第一字体单元在预设的第一词汇库中是否存在第二字体单元,其中所述第一字体单元为所述第一检索词中的任意一个字体单元;如果所述第一字体单元在所述第一词汇库中存在第二字体单元,根据第二字体单元和所述第一检索词确定第一检索集合,所述第一检索集合至少包括第一检索词和由所述第二字体单元和第三字体单元所组成的检索词,其中所述第三字体单元包括所述第一检索词中除所述第一字体单元外的其他字体单元以及所述其他字体单元对应的第二字体单元;对所述第一检索集合中的每一检索词进行检索,得到检索结果;对所述检索结果进行处理。
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:确定用户的输入请求,所述输入请求携带有第一检索词,所述第一检索词包括一个以及一个以上的字体单元;判断所述第一检索词中第一字体单元在预设的第一词汇库中是否存在第二字体单元,其中所述第一字体单元为所述第一检索词中的任意一个字体单元;如果所述第一字体单元在所述第一词汇库中存在第二字体单元,根据第二字体单元和所述第一检索词确定第一检索集合,所述第一检索集合至少包括第一检索词和由所述第二字体单元和第三字体单元所组成的检索词,其中所述第三字体单元包括所述第一检索词中除所述第一字体单元外的其他字体单元以及所述其他字体单元对应的第二字体单元;对所述第一检索集合中的每一检索词进行检索,得到检索结果;对所述检索结果进行处理。2.根据权利要求1所述的方法,其特征在于,所述对所述检索结果进行处理,包括:将满足条件的检索结果携带于数据响应中;将所述数据响应输出。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据第二词汇库生成图像库,所述图像库中的图像上显示的文字区域对应为所述第二字库中的文字;计算所述图像库中每一图像上文字区域的面积,并将所述图像上所述文字区域的面积与所述图像对应的文字建立关联信息;如果所述图像库中第一图像上的文字区域的面积Y1与第二图像上的文字区域的面积Y2不满足预设的第二关系表达式,则确定所述Y1与所述Y2的重合面积Y3;如果所述Y3、所述Y1和所述Y2满足预设的第三关系表达式,则确定所述第一图像对应的文字与所述第二图像对应的文字为形近字,并将所述第一图像对应的文字作为所述第二图像对应的文字的形近字加入所述第一词汇库,以及所述第二图像对应的文字作为所述第一图像对应的文字的形近字加入所述第一词汇库。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:如果所述图像库中第一图像上的文字区域的面积Y1与第二图像上的文字区域的面积Y2满足预设的第二关系表达式,则流程结束;如果所述Y3、所述Y1和所述Y2不满足预设的第三关系表达式,则流程结束。5.根据权利要求3或4所述的方法,其特征在于,所述计算所述图像库中每一图像上文字区域的面积,包括:如果所述图像上的文字区域对应有像素点,则Y计数加一;如果所述图像上的非文字区域对应有像素点,则N计数加一,其中,所述Y初始为0,所述N初始为0;如果Y与N之和与所述图像的所有图像点满足预设的第一关系表达式,则所述图像的文字区域的面积为Y;如果Y与N之和与所述图像的所有图像点不满足预设的第一关系表达式,则重复计算所述Y和所述N,直至所述Y和所述N满足所述第一关系表达式。6.根据权利要求3所述的方法,其特征在于,所述第二关系表达式为:|Y1-Y2|>(Y1+Y2)×L%/2,L为设定的阈值,所述L为整数。7.根据权利要求3所述的方法,其特征在于,所述第三...
【专利技术属性】
技术研发人员:陈虹,
申请(专利权)人:中国移动通信集团公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。