基于用户的状态信息标签用户的方法及装置制造方法及图纸

技术编号:4251351 阅读:203 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种基于用户的状态信息标签用户的方法及装置,在基于用户的状态信息标签用户的方法中,首先,收集用户的状态信息,然后,对所收集的用户的状态信息中的文本信息进行文本挖掘以提取关键词,并使用关键词作为标签对用户加标签。本发明专利技术的基于用户的状态信息标签用户的方法通过对用户的状态信息进行分析而得到用户的标签,使得用户的标签更能反映用户的兴趣及状态,并且能够自动更新用户的标签,从而及时地反映用户的兴趣及状态变化。

【技术实现步骤摘要】

本专利技术涉及计算机通信领域,例如,即时通信系统、BBS系统等,具 体地说,涉及在上述的系统中基于用户的状态信息标签用户的方法和装置。
技术介绍
在提供即时通信服务的系统中,每个使用即时通信服务的用户都具有 状态信息。用户的状态信息可以自动呈现给该用户的联系人列表中的用户, 这样,这些用户通过该用户的状态信息能够知道该用户的当前状态。最初,状态信息是由即时通信服务提供商提供,如在线、离线、忙碌、 离开等状态。目前,许多即时通信工具,例如MSN、 QQ、 Google Talk 等,都提供可由用户定制状态信息的功能。这样,状态信息不仅可以表示 用户的在线/离线状态(例如忙碌、离开等),还可以表示用户的当前情绪 (例如高兴、悲伤等)、用户的当前位置(例如在北京、在纽约等)、用 户的兴趣(例如哈利波特、羽毛球等)等。为简化表述,在本说明书中, 使用用户的兴趣,,统一指称用户的状态、情绪、位置、兴趣等可以从用 户状态信息中提取的用户相关信息。打标签是一种方便的分类功能,通过打标签,可以方便地管理或搜索 相关的信息。用户的标签通常与用户的兴趣相关,根据用户的标签,可以 帮助用户搜索感兴趣的信息或有相同兴趣的用户。目前,给用户打标签主要有两种方式Google公司提供的个性化搜索 和例如Consumating等交友网站提供的标签功能。Google个性化搜索是对Google搜索的改进,其可以根据用户的兴趣 爱好排列搜索结果。首先,根据用户的搜索历史,提取用户的兴趣信息,该兴^H言息可以作为用户的标签。当用户进行新的搜索时,根据该用户的 标签对搜索结果进行重新排序,对接近用户兴趣的结果赋予更高的权重。 然而,用户搜索的关键字绝大多数情况下仅能间接反映该用户的兴趣,同 时,对于这样提取的标签,由于隐私问题,用户可能不希望服务提供商对 其做进一步的应用,如搜索与其具有相同兴趣的用户等。而Consumating网站向用户提供标签输入功能,由用户在注册时输入 表示自己的兴趣爱好的标签。用户可以增加、j多改或删除标签,并且利用 这些标签,用户可以搜索与自己有相同兴趣的用户。然而,这种方式只能 由用户手动地更新标签,而通常用户会疏于更新自己的标签,导致不能及 时更新用户的标签。
技术实现思路
本专利技术正是鉴于上述技术问题而提出的,其目的在于提供一种基于用 户的状态信息标签用户的方法和装置,其使得用户的标签能够更准确地反 映用户的兴趣及其变化,并能够自动更新用户的标签。根据本专利技术的第一个方面,提供一种基于用户的状态信息标签用户的 方法,包括收集所述用户的状态信息;对所收集的所述用户的状态信息 中的文本信息进行文本挖掘以提取关键词;以及使用所述关键词作为标签 对所述用户加标签。根据本专利技术的第二个方面,提供一种基于用户的状态信息标签用户的 装置,包括收集单元,用于收集所述用户的状态信息;文本挖掘单元, 用于对由所述收集单元收集的所述用户的状态信息中的文本信息进行文本 挖掘,以提取关键词;以及加标签单元,用于使用所述关键词作为标签对 所述用户加标签。附图说明图1是才艮据本专利技术的一个实施例的基于用户的状态信息标签用户的方 法的流程8图2是根据本专利技术的另一个实施例的基于用户的状态信息标签用户的 方法的流程图3是作为用户的标签的一个应用的对多个用户进行分组的流程图; 图4是i兌明关联用户网的一个例子的示意图5是作为用户的标签的另一个应用的向用户投递个性化广告的流程图6是作为用户的标签的另一个应用的推测趋势信息的流程图; 图7是作为用户的标签的另 一个应用的获取用户的历史状态信息的流 程图8是根据本专利技术的第一实施例的基于用户的状态信息标签用户的装 置的方框图9是根据本专利技术的第二实施例的基于用户的状态信息标签用户的装 置的方框图10是4艮据本专利技术的第三实施例的基于用户的状态信息标签用户的 装置的方框图11是根据本专利技术的第四实施例的基于用户的状态信息标签用户的 装置的方才匡图12是根据本专利技术的第五实施例的基于用户的状态信息标签用户的 装置的方框图13是根据本专利技术的第六实施例的基于用户的状态信息标签用户的 装置的方框图。具体实施例方式相信通过以下结合附图对本专利技术的具体实施例的详细描述,本专利技术的 上述和其它目的、特征和优点会变得更加明显。图1是根据本专利技术的一个实施例的基于用户的状态信息标签用户的方 法的流程图。下面结合附图对本实施例进行详细的描述。在本实施例以及后面的实施例中,以即时通信系统的用户为例进4亍说明。当然,本实施例以及后面的实施例也适用于其它具有向用户拔_供状态 信息的功能的系统。如图1所示,首先在步骤sioo,收集用户的状态信息。如前所述,状态信息可以是用户输入的信息,包括文本信息和非文本信息,例如图片。 用户输入的信息可以反映用户的当前情绪(例如高兴、悲伤等)、用户的 活动信息(例如购物、周末观看展览等)、用户的当前位置(例如在北京 等)、用户的爱好(例如游戏、羽毛球)等。状态信息也可以是系统为用 户生成的信息,例如状态信息产生的时间、用户正在听的歌曲的信息、系 统生成的用户的活动信息(例如忙碌、离开等)等。在即时通信息系统中, 用户的状态信息的一部分,例如用户输入的信息、系统生成的用户的活动 信息,可以呈现给该用户的联系人列表中的用户。进一步地,在收集了用户的状态信息后,对用户的状态信息进行存储(步骤S105)。在本实施例中,采用用户标识+状态信息+状态信息的时 间戳的格式存储状态信息。本领域的普通技术人员容易理解,也可以采 用其它格式存储状态信息。接着,在步骤SllO,对所收集的用户的状态信息中的文本信息进行文 本挖掘,以提取关键词。在本实施例中,采用基于N元语言模型的文本挖 掘技术。具体地,对于每一个文本信息,去除该文本信息中的停用词,然 后对该文本信息中剩余的词进行词根还原,并对该文本信息进行N元切分, 以获得该文本信息的关键词。关于基于N元语言4莫型的文本挖掘4支术的详情,可以参看C. Y. Suen 所著的 N-Gram Statistics for Natural Language Understanding and Text Processing , IEEE Trans. On Pattern Analysis and Machine Intelligence, vol. 1, No. 2, April 1979, pp. 164-172.当然,本领域的普通技术人员容易知道,还可以采用其它文本挖掘技 术来处理文本信息。然后,在步骤s120,使用在步骤siio中获得的关键:词作为标签对用 户加标签,从而获得用户的标签数据。对于用户手动输入的标签,则自动成为用户的标签,加入用户的标签数据中。另外,当用户更新了自己的状态信息时,本实施例的方法还包括检 查用户是否有新的状态信息(步骤S125)。该步骤可以定期执行,也可以 在用户每次更新状态信息后立即执行,如果在步骤S125中检查到用户有新 的状态信息,则返回执行步骤S100至S120。通过以上描述可以看出,本实施例的基于用户的状态信息标签用户的 方法通过对用户的状态信息进行分析而得到用户的标签,使得用户的标签 更能反映用户的兴趣及状态,并且能够自动更新用户的标签,从而及时本文档来自技高网
...

【技术保护点】
一种基于用户的状态信息标签用户的方法,包括: 收集所述用户的状态信息; 对所收集的所述用户的状态信息中的文本信息进行文本挖掘以提取关键词;以及 使用所述关键词作为标签对所述用户加标签。

【技术特征摘要】
1. 一种基于用户的状态信息标签用户的方法,包括收集所述用户的状态信息;对所收集的所述用户的状态信息中的文本信息进行文本挖掘以提取关键词;以及使用所述关键词作为标签对所述用户加标签。2. 根据权利要求1所述的基于用户的状态信息标签用户的方法,其 中,所述文本挖掘步骤包括对于每一个所述文本信息,去除该文本信息中的停用词; 对该文本信息中剩余的词进行词根还原;以及 对该文本信息进行N元切分,以获得该文本信息的关键词。3. 根据权利要求1或2所述的基于用户的状态信息标签用户的方法, 还包括检查所述用户是否有新的状态信息;以及如果有,则对所述新的状态信息执行所述收集步骤、所述文本挖掘步 骤和所述加标签步骤。4. 根据权利要求1至3任意一项所述的基于用户的状态信息标签用 户的方法,还包括存储所收集的所述用户的状态信息。5. 根据权利要求1至4任意一项所述的基于用户的状态信息标签用 户的方法,还包括计算所述关^;词的出现次数;以及选择预定数量的出现次数最多的关键词,作为所述用户的标签。6. 才艮据权利要求1至5任意一项所述的基于用户的状态信息标签用 户的方法,其中,每一个用户的标签构成该用户的标签数据,所述方法还 包括对于所述多个用户的每一个,计算该用户的标签数据与其他各个用户的标签数据之间的相似选择预定数量的具有最大相似度的用户,以组成与该用户具有相似兴趣的用户集;提取该用户与所述用户集中每一个用户之间的共有标签;以及 将所述多个用户中具有与上述共有标签相同的标签的用户聚集为用户 群组,其中上述共有标签作为群组名称。7. 根据权利要求6所述的基于用户的状态信息标签用户的方法,还 包括检查所述多个用户的标签数据中是否有新的标签; 如果有新的标签,则对于具有所述新的标签的用户,搜索群组名称包含所述新的标签的用户群组;将该用户加入所搜索到的用户群组; 检查是否有新的用户; 如果有新的用户,则对所述新的用户的标签数据中的每一个标签,搜索群组名称包含 该标签的用户群组;将所述新的用户加入所搜索到的各个用户群组;8. 根据权利要求1至6任意一项所述的基于用户的状态信息标签用 户的方法,其中,所述用户的标签构成该用户的标签数据,所迷方法还包 括根据所述用户的标签数据,选择符合所述用户的标签的广告作为所述 用户的个性化广告;以及将所述个性化广告推送给所述用户。9. 根据权利要求1至6任意一项所述的基于用户的状态信息标签用 户的方法,其中,所述用户的标签构成该用户的标签数据,所述方法包括指定用户的范围;收集所指定的范围内的所有用户的标签数据; 计算所收集的标签数据中各个标签的出现次数;以及确定预定数量的出现次数最高的标签,作为所指定的用户范围内的趋 势信息。10. 根据权利要求1至6任意一项所述的基于用户的状态信息标签用 户的方法,还包括所述用户指定至少一个标签;对于所指定的至少一个标签的每一个,在所存储的所述用户的状态信 息中搜索对应的文本信息;根据所搜索到的文本信息的时间戳,获得具有相同时间戳的非文本信 息;以及按照时间顺序排列上述文本信息和非文本信息。11. 一种基于用户的状态信息标签用户的装置,包括 状态信息收集单元,用于收集所述用户的状态信息; 文本挖掘单元,用于对由所述状态信息收集单元收集的所述用户的状态信息中的文本信息进行文本挖掘,以提取关键词;以及加标签单元,用于使用所述关键词作为标签对所述用户加标签。12. 根据权利要求11所述的基于用户的状态信息标...

【专利技术属性】
技术研发人员:舒芳蕊
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1