一种输入法的字库配置方法、装置以及调用处理方法制造方法及图纸

技术编号:15391124 阅读:24 留言:0更新日期:2017-05-19 04:34
本申请公开了一种输入法的字库配置方法、装置以及调用处理方法,包括:根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容;将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;对所述文字合集进行分词并从分词中提取常用词,将使用热度大于预定值的常用词保存至与所述文字合集关联的所述联系人的分字库中。本申请可根据联系人与用户的聊天内容,为不同的联系人配置专属的分字库,用户与联系人聊天时可调用所述联系人关联的分字库,从而使输入法更加符合用户对于不同联系人的聊天习惯,并可大大提高了符合用户与所述联系人聊天习惯的常用词的命中率。

Input method, font configuration method, device and calling processing method

The invention discloses a configuration method, character input method and device call processing method, including: according to the social software user terminal contacts, chat between search and extract the user with the contact; the chat content into text collections, and the resulting text collection and the corresponding contact Association for the preservation; word segmentation and text extraction from the collection of commonly used word segmentation, divided font will be used more than heat preservation of commonly used words of the predetermined value to the text collection related to the contact person of the. This application can chat according to the contact with the user, for the different contact configuration of the exclusive character, users and contacts when chatting can be divided into font calls the contact connection, so that the input method is more suitable for users in different contact chat habits, and can greatly improve the hit rate of common words with the user contact the habit of talking.

【技术实现步骤摘要】
一种输入法的字库配置方法、装置以及调用处理方法
本申请属于字库处理
,具体地说,涉及一种输入法的字库配置方法及装置。
技术介绍
随着互联网的迅猛发展,社交软件的种类变得越来越丰富,比较主流的包括QQ、微信、MSN等,可借助互联网实现用户之间的即时通讯。通常,社交软件都会提供聊天对象名单,类似于手机的通讯录,用户可选择聊天对象名单中的某人进行聊天。聊天对象名单中包含亲戚、朋友、同学、同事等与用户有社交关系的人,经过统计发现,用户对于不同社交关系的聊天对象会采用不同的聊天方式,例如,与同事聊天时,大多涉及工作相关的事务,聊天的内容比较严肃,词条比较严谨;与家人聊天时,大多涉及家长里短,聊天的内容比较随意,词条也比较口语化,甚至有些方言;而与朋友聊天时,聊天的内容大多涉及休闲娱乐,词条则会比较活泼、轻松,甚至使用一些网络热词。所以,用户在使用社交软件时,对于不同的聊天对象,经常使用的词是各不相同的,而现有的输入法通常仅包含一个字库,无论聊天对象是谁,输入法使用的都是同一个字库且对于词条热度采用的是同一个标准,无法为不同的聊天对象提供个性化的字库。
技术实现思路
有鉴于此,本申请所要解决的技术问题是提供了一种输入法的字库配置方法、装置以及调用处理方法,为不同的联系人配置专属的分字库,从而使输入法更加符合用户对于不同联系人的聊天习惯。为了解决上述技术问题,本申请公开了一种输入法的字库配置方法,包括:根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容;将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;对所述文字合集进行分词并从分词中提取常用词,将使用热度大于预定值的常用词保存至与所述文字合集关联的所述联系人的分字库中。优选地,根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容,进一步包括:针对用户终端中每个社交软件,依照所述社交软件的联系人查找并提取用户与每个联系人之间的聊天内容。优选地,将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存,进一步包括:通过统一标识识别所述用户终端中各个社交软件中相同的联系人,其中各个社交软件中相同的联系人具有相同的统一标识;将各个社交软件中所述相同的联系人与用户之间的聊天内容转换为文字合集后进行合并,并将生成的文字合集与所述相同的联系人及其统一标识进行关联保存。优选地,将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存,进一步包括:针对每个社交软件,将其中每个联系人与用户之间的聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;通过统一标识识别所述用户终端中各个社交软件中相同的联系人,其中各个社交软件中相同的联系人具有相同的统一标识;将各个社交软件中所述相同的联系人的文字合集后进行合并,并将生成的文字合集与所述相同的联系人及其统一标识进行关联保存。优选地,所述统一标识包括以下一个或多个的组合:用户终端号码、联系人名字、备注名。优选地,将使用热度大于预定值的常用词保存至与所述文字合集关联的所述联系人的分字库中,进一步包括:依照输入法的编码方法,解析得到所述分字库中保存的所述常用词的编码,将所述编码与所述常用词对应保存在所述分字库中。优选地,所述编码方法,包括:拼音、形码、音形结合、内码。优选地,将所述聊天内容转换为文字合集,进一步包括:提取所述聊天内容中的语音和文字;根据声音参数将所述语音拆分为多个语音元素,并按照预设的语音元素与文字的映射关系,将所述语音转换为文字;将转换获得的文字与所述聊天记录中的文字合并为文字合集。优选地,对所述文字合集进行分词并提取常用词,进一步包括:对所述文字合集进行语义分析,获得多个分词;过滤所述多个分词中的停用词,获得常用词。优选地,将使用热度大于预定值的常用词保存至所述联系人关联的分字库,进一步包括:根据使用频率标注所述常用词的词频,并生成词频列表;根据预设规则设定所述常用词的权重,并根据所述常用词的权重调整所述词频列表以生成使用热度列表。优选地,所述预设规则包括:与所述常用词的常见度呈反比或者与用户输入文字时将所述常用词设定为置于首位的次数呈正比。本申请还公开了一种输入法的字库配置装置,包括:查询装置,用于根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容;转换装置,用于将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;分词存储装置,用于对所述文字合集进行分词并从分词中提取常用词,将使用热度大于预定值的常用词保存至与所述文字合集关联的所述联系人的分字库中。优选地,所述查询装置,进一步用于:针对用户终端中每个社交软件,依照所述社交软件的联系人查找并提取用户与每个联系人之间的聊天内容。优选地,所述转换装置,进一步用于:通过统一标识识别所述用户终端中各个社交软件中相同的联系人,其中各个社交软件中相同的联系人具有相同的统一标识;将各个社交软件中所述相同的联系人与用户之间的聊天内容转换为文字合集后进行合并,并将生成的文字合集与所述相同的联系人及其统一标识进行关联保存。优选地,所述转换装置,进一步用于:针对每个社交软件,将其中每个联系人与用户之间的聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;通过统一标识识别所述用户终端中各个社交软件中相同的联系人,其中各个社交软件中相同的联系人具有相同的统一标识;将各个社交软件中所述相同的联系人的文字合集后进行合并,并将生成的文字合集与所述相同的联系人及其统一标识进行关联保存。优选地,所述统一标识包括以下一个或多个的组合:用户终端号码、联系人名字、备注名。优选地,所述分词存储装置,进一步用于:依照输入法的编码方法,解析得到所述分字库中保存的所述常用词的编码,将所述编码与所述常用词对应保存在所述分字库中。优选地,所述编码方法,包括:拼音、形码、音形结合、内码。优选地,所述转换装置,进一步用于:提取所述聊天内容中的语音和文字;根据声音参数将所述语音拆分为多个语音元素,并按照预设的语音元素与文字的映射关系,将所述语音转换为文字;将转换获得的文字与所述聊天记录中的文字合并为文字合集。优选地,所述分词存储装置,进一步用于:对所述文字合集进行语义分析,获得多个分词;过滤所述多个分词中的停用词,获得常用词。优选地,所述分词存储装置,进一步用于:根据使用频率标注所述常用词的词频,并生成词频列表;根据预设规则设定所述常用词的权重,并根据所述常用词的权重调整所述词频列表以生成使用热度列表。优选地,所述预设规则包括:与所述常用词的常见度呈反比或者与用户输入文字时将所述常用词设定为置于首位的次数呈正比。本申请还公开了一种输入法的字库调用处理方法,包括:启动输入法,识别用户终端中当前社交软件的联系人;调用所述联系人关联的分字库,其中,所述联系人关联的分字库的配置过程为:根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容;将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;对所述文字合集进行分词并从分词中提取常用词,将使用热度大于预定值的常用词保存至与所述文字合集关联的所述联系人本文档来自技高网...
一种输入法的字库配置方法、装置以及调用处理方法

【技术保护点】
一种输入法的字库配置方法,其特征在于,包括:根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容;将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;对所述文字合集进行分词并从分词中提取常用词,将使用热度大于预定值的常用词保存至与所述文字合集关联的所述联系人的分字库中。

【技术特征摘要】
1.一种输入法的字库配置方法,其特征在于,包括:根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容;将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;对所述文字合集进行分词并从分词中提取常用词,将使用热度大于预定值的常用词保存至与所述文字合集关联的所述联系人的分字库中。2.如权利要求1所述的方法,其特征在于,根据用户终端中各社交软件的联系人,查找并提取用户与所述联系人之间的聊天内容,进一步包括:针对用户终端中每个社交软件,依照所述社交软件的联系人查找并提取用户与每个联系人之间的聊天内容。3.如权利要求2所述的方法,其特征在于,将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存,进一步包括:通过统一标识识别所述用户终端中各个社交软件中相同的联系人,其中各个社交软件中相同的联系人具有相同的统一标识;将各个社交软件中所述相同的联系人与用户之间的聊天内容转换为文字合集后进行合并,并将生成的文字合集与所述相同的联系人及其统一标识进行关联保存。4.如权利要求2所述的方法,其特征在于,将所述聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存,进一步包括:针对每个社交软件,将其中每个联系人与用户之间的聊天内容转换为文字合集,并将生成的文字合集与相应的联系人进行关联保存;通过统一标识识别所述用户终端中各个社交软件中相同的联系人,其中各个社交软件中相同的联系人具有相同的统一标识;将各个社交软件中所述相同的联系人的文字合集后进行合并,并将生成的文字合集与所述相同的联系人及其统一标识进行关联保存。5.如权利要求3或4所述的方法,其特征在于,所述统一标识包括以下一个或多个的组合:用户终端号码、联系人名字、备注名。6.如权利要求1所述的...

【专利技术属性】
技术研发人员:王务志王军
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1