The embodiment of this application discloses methods and devices for updating information. One specific embodiment of the method includes: obtaining at least one subject name entry from the information to be processed; matching the subject name entry with at least one initial information source subject name entry obtained in advance for at least one subject name entry mentioned above, and setting the weight value for the subject name entry according to the matching result; and matching the subject name entry according to the weight value. At least one subject name entry in the above-mentioned subject name entry and at least one initial information source subject name entry in the above-mentioned initial information source subject name entry are sorted to obtain at least one updated initial information source subject name entry. The implementation method improves the accuracy and efficiency of information acquisition by users.
【技术实现步骤摘要】
用于更新信息的方法及装置
本申请实施例涉及数据处理
,具体涉及用于更新信息的方法及装置。
技术介绍
随着信息化程度的提高,多个领域都积累了海量的数据,网络小说就属于其中的一个领域。通常,网络小说可以在不同的时间、按照小说内容的先后顺序发布在网络上。用户通过网络可以获取到网络小说最新发布的小说内容。
技术实现思路
本申请实施例提出了用于更新信息的方法及装置。第一方面,本申请实施例提供了一种用于更新信息的方法,该方法包括:从待处理信息中获取至少一条主体名称词条;对于上述至少一条主体名称词条中的主体名称词条,将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,上述初始信息源主体名称词条和待处理信息与同一信息源对应,上述权值用于表征主体名称词条对应的主体为上述信息源的信息源主体的概率;根据权值对上述至少一条主体名称词条中主体名称词条和上述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。在一些实施例中,上述从待处理信息中获取至少一条主体名称词条,包括:查询上述待处理信息中语句的语法关系;根据语法关系对上述待处理信息包含的语句进行修正,得到更新待处理信息;对上述更新待处理信息进行信息提取,得到至少一条主体名称词条。在一些实施例中,上述根据语法关系对上述待处理信息包含的语句进行修正,得到更新待处理信息,包括:查询上述待处理信息中的至少一条待处理语句,上述待处理语句为缺少主体名称词条的语句;对于上述至少一条待处理语句中的待处理语句,根据对应该待处理语 ...
【技术保护点】
1.一种用于更新信息的方法,包括:从待处理信息中获取至少一条主体名称词条;对于所述至少一条主体名称词条中的主体名称词条,将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,所述初始信息源主体名称词条和待处理信息与同一信息源对应,所述权值用于表征主体名称词条对应的主体为所述信息源的信息源主体的概率;根据权值对所述至少一条主体名称词条中主体名称词条和所述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。
【技术特征摘要】
1.一种用于更新信息的方法,包括:从待处理信息中获取至少一条主体名称词条;对于所述至少一条主体名称词条中的主体名称词条,将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,所述初始信息源主体名称词条和待处理信息与同一信息源对应,所述权值用于表征主体名称词条对应的主体为所述信息源的信息源主体的概率;根据权值对所述至少一条主体名称词条中主体名称词条和所述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。2.根据权利要求1所述的方法,其中,所述从待处理信息中获取至少一条主体名称词条,包括:查询所述待处理信息中语句的语法关系;根据语法关系对所述待处理信息包含的语句进行修正,得到更新待处理信息;对所述更新待处理信息进行信息提取,得到至少一条主体名称词条。3.根据权利要求2所述的方法,其中,所述根据语法关系对所述待处理信息包含的语句进行修正,得到更新待处理信息,包括:查询所述待处理信息中的至少一条待处理语句,所述待处理语句为缺少主体名称词条的语句;对于所述至少一条待处理语句中的待处理语句,根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,得到修正后的更新待处理信息。4.根据权利要求3所述的方法,其中,所述根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,包括:根据该语法关系为该待处理语句添加对应的主体名称词条。5.根据权利要求3所述的方法,其中,所述待处理语句包含主体名称代词,以及所述根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,包括:根据该语法关系将该待处理语句中的主体名称代词替换为对应的主体名称词条。6.根据权利要求1至5任意一项所述的方法,其中,所述初始信息源主体名称词条通过以下步骤获取:从获取的待处理摘要信息中获取至少一条初始主体名称词条;对于所述至少一条初始主体名称词条中初始主体名称词条,确定该初始主体名称词条在所述待处理摘要信息中出现的次数,并根据该次数为该初始主体名称词条设置初始权值;根据初始权值从所述至少一条初始主体名称词条中确定至少一条初始信息源主体名称词条。7.一种用于更新信息的装置,包括:主体名称词条提取单元,被配置成从待处理信息中获取至少一条主体名称词条;权值设置单元,对于所述至少一条主体名称词条中的主体名称词条,被配置成将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,所述初始信息源主体名称词条...
【专利技术属性】
技术研发人员:伍志鹏,王志华,杨天行,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。