本发明专利技术提供一种词条的获取方法及装置。本发明专利技术实施例通过对用户的眼球进行跟踪操作,以获得所述用户的感兴趣区域,进而获取所述感兴趣区域内的文本信息,并对所述文本信息进行切词操作,以获得候选词条,使得能够选择至少一个候选词条,以作为新词和/或热词,由于采用用户当前的阅读行为所关注的区域所提取的用户感兴趣的文本信息,进行候选词条的获取操作,因此,能够基于这些文本信息及时地识别出新词和/或热词,从而提高了词条获取的及时性。
【技术实现步骤摘要】
【专利摘要】本专利技术提供一种词条的获取方法及装置。本专利技术实施例通过对用户的眼球进行跟踪操作,以获得所述用户的感兴趣区域,进而获取所述感兴趣区域内的文本信息,并对所述文本信息进行切词操作,以获得候选词条,使得能够选择至少一个候选词条,以作为新词和/或热词,由于采用用户当前的阅读行为所关注的区域所提取的用户感兴趣的文本信息,进行候选词条的获取操作,因此,能够基于这些文本信息及时地识别出新词和/或热词,从而提高了词条获取的及时性。【专利说明】词条的获取方法及装置【
】本专利技术涉及输入法技术,尤其涉及一种词条的获取方法及装置。【
技术介绍
】输入法,是指为将各种字符输入终端而采用的编码方法,不同语言、国家、或地区,有多种不同的输入法,例如,搜狗拼音输入法、百度输入法、QQ拼音输入法等。一般来说,输入法软件的客户端可以采用加载的字典即词库和字典中包含的词频,向用户展现各类候选词条的排序,以方便用户的输入。现有技术中,为了满足用户的输入需求,通过服务器定期采集词条和词条的使用频率即词频,以更新各类专业字典,例如,将新出现的词条识别为新词添加到字典中,或者,再例如,将一些使用频率高的词条识别为热词,等。然而,在一些情况下,新词和/或热词会大量涌现,例如,网络语言的出现如酱紫(这样子)、表(不要)、杯具(悲剧)等,或者,再例如,突发事件如台风海燕,等,现有的技术方案无法及时地将这些新词和/或热词识别出来更新输入法所加载的各类专业字典即输入法字典,从而导致了词条获取的及时性的降低。【
技术实现思路
】本专利技术的多个方面提供一种词条的获取方法及装置,用以提高词条获取的及时性。本专利技术的一方面,提供一种词条的获取方法,包括:对用户的眼球进行跟踪操作,以获得所述用户的感兴趣区域;获取所述感兴趣区域内的文本信息;对所述文本信息进行切词操作,以获得候选词条;选择至少一个候选词条,以作为新词和/或热词。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对用户的眼球进行跟踪操作,以获得所述用户的感兴趣区域,包括:获取所述眼球的视频信息;根据所述视频信息,确定所述眼球的位置区域;根据所述视频信息,确定所述眼球的可运动路径,以及根据所述可运动路径,确定所述眼球的可移动区域;根据所述眼球的位置区域和所述眼球的可移动区域,确定所述眼球的关注区域,以作为所述用户的感兴趣区域。如上所述的方 面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述眼球的位置和所述眼球的可移动区域,确定所述眼球的关注区域,以作为所述用户的感兴趣区域,包括:将所述眼球的位置区域在所述眼球的可移动区域内的部分,确定为所述眼球的关注区域;若所述眼球的关注区域满足关注条件,确定所述眼球的关注区域为所述用户的感兴趣区域。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述关注条件包括关注时间和关注频次中的至少一项。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述选择至少一个候选词条,以作为新词和/或热词,包括:将没有出现在预先配置的输入法字典中的候选词条确定为新词。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述选择至少一个候选词条,以作为新词和/或热词,包括:将出现在预先配置的输入法字典中的候选词条,确定为候选热词;根据所述候选热词出现的词频,确定所述候选热词的热度值;将热度值大于或等于热度阈值的候选热词,确定为热词。本专利技术的一方面,提供一种词条的获取装置,包括:跟踪单元,用于对用户的眼球进行跟踪操作,以获得所述用户的感兴趣区域;获取单元,用于获取所述感兴趣区域内的文本信息;切词单元,用于对所述文本信息进行切词操作,以获得候选词条;选择单元,用于选择至少一个候选词条,以作为新词和/或热词。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述跟踪单元,具体用于获取所述眼球的视频信息;根据所述视频信息,确定所述眼球的位置区域;根据所述视频信息,确定所述眼球的可运动路径,以及根据所述可运动路径,确定所述眼球的可移动区域;以及根据所述眼球的位置区域和所述眼球的可移动区域,确定所述眼球的关注区域,以作为所述用户的感兴趣区域。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述跟踪单元,具体用于将所述眼球的位置区域在所述眼球的可移动区域内的部分,确定为所述眼球的关注区域;以及若所述眼球的关注区域满足关注条件,确定所述眼球的关注区域为所述用户的感兴趣区域。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述关注条件包括关注时间和关注频次中的至少一项。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述选择单元,具体用于将没有出现在预先配置的输入法字典中的候选词条确定为新词。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述选择单元,具体用于将出现在预先配置的输入法字典中的候选词条,确定为候选热词;根据所述候选热词出现的词频,确定所述候选热词的热度值;以及将热度值大于或等于热度阈值的候选热词,确定为热词。由上述技术方案可知,本专利技术实施例通过对用户的眼球进行跟踪操作,以获得所述用户的感兴趣区域,进而获取所述感兴趣区域内的文本信息,并对所述文本信息进行切词操作,以获得候选词条,使得能够选择至少一个候选词条,以作为新词和/或热词,由于采用用户当前的阅读行为所关注的区域所提取的用户感兴趣的文本信息,进行候选词条的获取操作,因此,能够基于这些文本信息及时地识别出新词和/或热词,从而提高了词条获取的及时性。另外,采用本专利技术提供的技术方案,能够及时地利用所识别出的新词和/或热词更新输入法所加载的各类专业字典即输入法字典,能够进一步有效提高输入法的字典的准确性。【【专利附图】【附图说明】】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的词条的获取方法的流程示意图;图2为本专利技术另一实施例提供的词条的获取装置的结构示意图。【【具体实施方式】】为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本专利技术保护的范围。需要说明的是,本专利技术实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant, PDA)、无线手持设备、平板电脑(Tablet Computer)>个人电脑(Personal Computer, PC)、MP3播放器、MP4播放器等。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。图1本文档来自技高网...
【技术保护点】
一种词条的获取方法,其特征在于,包括:对用户的眼球进行跟踪操作,以获得所述用户的感兴趣区域;获取所述感兴趣区域内的文本信息;对所述文本信息进行切词操作,以获得候选词条;选择至少一个候选词条,以作为新词和/或热词。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈晓昕,吴先超,肖日新,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。