【技术实现步骤摘要】
一种基于异构信息网络的兴趣列表推送系统
本专利技术涉及信息处理领域,尤其涉及一种基于异构信息网络的兴趣列表推送系统。
技术介绍
互联网规模和覆盖面的迅速增长带来了信息超载的问题,过量信息同时呈现使得用户无法从中获取对自己有用的部分,导致信息的使用效率反而降低。异构信息网络(HeterogeneousInformationNetwork,HIN)通过网络模式指定了对象集合上的类型约束和关系约束,这些约束决定了异构信息网络是半结构化的,对人们探索网络语义起到了指导作用。但是国内外基于异构信息网络的推荐还处在初级阶段,个性化推荐系统作为解决信息超载的一个有力工具。通常,个性化推荐系统的原理主要是通过信息筛选过滤无用信息,然后对有效的用户数据和用户行为进行分析处理,获取用户行为偏好,进而对不同用户进行个性化推荐,更好地满足了用户需求,深受用户喜爱。但是现有的个性化推荐系统比较依赖于用户的数据或行为,对于不曾产生数据或行为的潜在用户则无法进行推荐,使得推送效果欠佳。
技术实现思路
为此,本专 ...
【技术保护点】
1.一种基于异构信息网络的兴趣列表推送系统,其特征在于,包括:/n获取模块,用以获取用户的登录信息和关键字信息,所述关键字为当前用户与第二用户在聊天记录中所包含的信息;/n建立模块,用以根据用户的登录信息建立信息矩阵I(I1,I2,I3,I4,I5),其中I1表示基于性别信息的第一数据列表,I2表示基于年龄信息的第二数据列表,I3表示基于职业信息的第三数据列表,I4表示基于地域信息的第四数据列表,I5表示基于时间的第五数据列表;/n确定模块,根据信息矩阵和登录信息确定当前用户的兴趣列表;/n推送模块,将该兴趣列表推送给第二用户,第二用户是通过搜索关键字获取的;/n中央处理器 ...
【技术特征摘要】
1.一种基于异构信息网络的兴趣列表推送系统,其特征在于,包括:
获取模块,用以获取用户的登录信息和关键字信息,所述关键字为当前用户与第二用户在聊天记录中所包含的信息;
建立模块,用以根据用户的登录信息建立信息矩阵I(I1,I2,I3,I4,I5),其中I1表示基于性别信息的第一数据列表,I2表示基于年龄信息的第二数据列表,I3表示基于职业信息的第三数据列表,I4表示基于地域信息的第四数据列表,I5表示基于时间的第五数据列表;
确定模块,根据信息矩阵和登录信息确定当前用户的兴趣列表;
推送模块,将该兴趣列表推送给第二用户,第二用户是通过搜索关键字获取的;
中央处理器,分别与获取模块、建立模块、确定模块以及推送模块连接,用以根据建立模块内的信息矩阵调整确定模块中的兴趣列表中的实时信息;
从第一用户与第二用户的聊天记录中确定关键字信息包括:
中央处理器获取第一用户与其他用户的聊天记录信息,设置聊天记录信息包括N1,N2,N3…Nn多条信息,每条信息的长度分别为L1,L2,L3…Ln,关键字的长度设置在标准字段长度ln,中央处理器内设置有关键字的近似信息库,近似信息库内包含有关键字的多个近似字段信息;
在确定聊天信息内是否包含关键字时,将每条信息的长度分别与标准字段长度进行比较,若Li<标准字段长度ln,则表示该条信息内不包含关键字;
若Li≥标准字段长度ln,则将满足长度要求的聊天信息建立聊天信息矩阵M(M1,M2…Mk),其中k<n,对于聊天信息矩阵中的聊天信息进行判断时,从聊天信息Mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字。
2.根据权利要求1所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
在确定聊天信息内是否包含关键字时,还包括:从聊天信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字。
3.根据权利要求2所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
在比较的过程中,若聊天信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是聊天信息中包含关键字,此时判定聊天信息Mi中不包含标准字段的字符。
4.根据权利要求2所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
若对于聊天信息Mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该聊天信息内包含关键字,若小于等于90%则需要进一步判断。
5.根据权利要求4所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
当需要对聊天信息是否包含关键字进行进一步判断时,近似信息库内包含有关键字的多个近似字段信息,分别为Y1,Y2…Yn,近似字段为关键字的相似或相近字段,根据近似信息库对聊天信息进行进一步判断,判段聊天信息内是否包含关键字的相似或相近字段,若包含,则该聊天信息包含关键字,若不包含相似或相近字段,则认定该聊天信息不包含关键字。
6.根据权利要求5述的基于异构信息网络的兴趣列表推送系统,其特征在于,
在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似...
【专利技术属性】
技术研发人员:刘利萍,
申请(专利权)人:广州汇图计算机信息技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。