用于更新信息的方法及装置制造方法及图纸

技术编号:20176708 阅读:27 留言:0更新日期:2019-01-23 00:23
本申请实施例公开了用于更新信息的方法及装置。该方法的一具体实施方式包括:从待处理信息中获取至少一条主体名称词条;对于上述至少一条主体名称词条中的主体名称词条,将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值;根据权值对上述至少一条主体名称词条中主体名称词条和上述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。该实施方式提高了用户获取信息的准确性和效率。

Method and device for updating information

The embodiment of this application discloses methods and devices for updating information. One specific embodiment of the method includes: obtaining at least one subject name entry from the information to be processed; matching the subject name entry with at least one initial information source subject name entry obtained in advance for at least one subject name entry mentioned above, and setting the weight value for the subject name entry according to the matching result; and matching the subject name entry according to the weight value. At least one subject name entry in the above-mentioned subject name entry and at least one initial information source subject name entry in the above-mentioned initial information source subject name entry are sorted to obtain at least one updated initial information source subject name entry. The implementation method improves the accuracy and efficiency of information acquisition by users.

【技术实现步骤摘要】
用于更新信息的方法及装置
本申请实施例涉及数据处理
,具体涉及用于更新信息的方法及装置。
技术介绍
随着信息化程度的提高,多个领域都积累了海量的数据,网络小说就属于其中的一个领域。通常,网络小说可以在不同的时间、按照小说内容的先后顺序发布在网络上。用户通过网络可以获取到网络小说最新发布的小说内容。
技术实现思路
本申请实施例提出了用于更新信息的方法及装置。第一方面,本申请实施例提供了一种用于更新信息的方法,该方法包括:从待处理信息中获取至少一条主体名称词条;对于上述至少一条主体名称词条中的主体名称词条,将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,上述初始信息源主体名称词条和待处理信息与同一信息源对应,上述权值用于表征主体名称词条对应的主体为上述信息源的信息源主体的概率;根据权值对上述至少一条主体名称词条中主体名称词条和上述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。在一些实施例中,上述从待处理信息中获取至少一条主体名称词条,包括:查询上述待处理信息中语句的语法关系;根据语法关系对上述待处理信息包含的语句进行修正,得到更新待处理信息;对上述更新待处理信息进行信息提取,得到至少一条主体名称词条。在一些实施例中,上述根据语法关系对上述待处理信息包含的语句进行修正,得到更新待处理信息,包括:查询上述待处理信息中的至少一条待处理语句,上述待处理语句为缺少主体名称词条的语句;对于上述至少一条待处理语句中的待处理语句,根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,得到修正后的更新待处理信息。在一些实施例中,上述根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,包括:根据该语法关系为该待处理语句添加对应的主体名称词条。在一些实施例中,上述待处理语句包含主体名称代词,以及,上述根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,包括:根据该语法关系将该待处理语句中的主体名称代词替换为对应的主体名称词条。在一些实施例中,上述初始信息源主体名称词条通过以下步骤获取:从获取的待处理摘要信息中获取至少一条初始主体名称词条;对于上述至少一条初始主体名称词条中初始主体名称词条,确定该初始主体名称词条在上述待处理摘要信息中出现的次数,并根据该次数为该初始主体名称词条设置初始权值;根据初始权值从上述至少一条初始主体名称词条中确定至少一条初始信息源主体名称词条。第二方面,本申请实施例提供了一种用于更新信息的装置,该装置包括:主体名称词条提取单元,被配置成从待处理信息中获取至少一条主体名称词条;权值设置单元,对于上述至少一条主体名称词条中的主体名称词条,被配置成将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,上述初始信息源主体名称词条和待处理信息与同一信息源对应,上述权值用于表征主体名称词条对应的主体为上述信息源的信息源主体的概率;信息更新单元,被配置成根据权值对上述至少一条主体名称词条中主体名称词条和上述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。在一些实施例中,上述更新待处理信息获取子单元包括:待处理语句查询模块,被配置成查询上述待处理信息中的至少一条待处理语句,上述待处理语句为缺少主体名称词条的语句;更新待处理信息获取模块,对于上述至少一条待处理语句中的待处理语句,被配置成根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,得到修正后的更新待处理信息。在一些实施例中,上述主体名称词条提取单元包括:语法关系查询子单元,被配置成查询上述待处理信息中语句的语法关系;更新待处理信息获取子单元,被配置成根据语法关系对上述待处理信息包含的语句进行修正,得到更新待处理信息;主体名称词条提取子单元,被配置成对上述更新待处理信息进行信息提取,得到至少一条主体名称词条。在一些实施例中,上述更新待处理信息获取模块包括:信息添加子模块,被配置成根据该语法关系为该待处理语句添加对应的主体名称词条。在一些实施例中,上述待处理语句包含主体名称代词,以及,上述更新待处理信息获取模块包括:信息替换子模块,被配置成根据该语法关系将该待处理语句中的主体名称代词替换为对应的主体名称词条。在一些实施例中,上述装置包括初始信息源主体名称词条获取单元,被配置成获取初始信息源主体名称词条,上述初始信息源主体名称词条获取单元包括:初始主体名称词条获取子单元,被配置成从获取的待处理摘要信息中获取至少一条初始主体名称词条;初始权值设置子单元,对于上述至少一条初始主体名称词条中初始主体名称词条,被配置成确定该初始主体名称词条在上述待处理摘要信息中出现的次数,并根据该次数为该初始主体名称词条设置初始权值;初始信息源主体名称词条确定子单元,被配置成根据初始权值从上述至少一条初始主体名称词条中确定至少一条初始信息源主体名称词条。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于更新信息的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面的用于更新信息的方法。本申请实施例提供的用于更新信息的方法及装置,首先从待处理信息中获取至少一条主体名称词条,然后将主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为主体名称词条设置权值,最后根据权值对人物进行排序,得到更新后的至少一条初始信息源主体名称词条,提高了用户获取信息的准确性和效率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于更新信息的方法的一个实施例的流程图;图3是根据本申请的用于更新信息的方法的一个应用场景的示意图;图4是根据本申请的获取初始信息源主体名称词条的一个实施例的流程图;图5是根据本申请的用于更新信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请实施例的用于更新信息的方法或用于更新信息的装置的示例性系统架构100。如图1所示,系统架构100可以包括数据处理服务器101,网络102和信息服务器103、104、105、106。网络102用以在数据处理服务器101和信息服务器103、104、105、106之间提供通信链路的介质。网络102可本文档来自技高网...

【技术保护点】
1.一种用于更新信息的方法,包括:从待处理信息中获取至少一条主体名称词条;对于所述至少一条主体名称词条中的主体名称词条,将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,所述初始信息源主体名称词条和待处理信息与同一信息源对应,所述权值用于表征主体名称词条对应的主体为所述信息源的信息源主体的概率;根据权值对所述至少一条主体名称词条中主体名称词条和所述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。

【技术特征摘要】
1.一种用于更新信息的方法,包括:从待处理信息中获取至少一条主体名称词条;对于所述至少一条主体名称词条中的主体名称词条,将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,所述初始信息源主体名称词条和待处理信息与同一信息源对应,所述权值用于表征主体名称词条对应的主体为所述信息源的信息源主体的概率;根据权值对所述至少一条主体名称词条中主体名称词条和所述至少一条初始信息源主体名称词条中初始信息源主体名称词条进行排序,得到更新后的至少一条初始信息源主体名称词条。2.根据权利要求1所述的方法,其中,所述从待处理信息中获取至少一条主体名称词条,包括:查询所述待处理信息中语句的语法关系;根据语法关系对所述待处理信息包含的语句进行修正,得到更新待处理信息;对所述更新待处理信息进行信息提取,得到至少一条主体名称词条。3.根据权利要求2所述的方法,其中,所述根据语法关系对所述待处理信息包含的语句进行修正,得到更新待处理信息,包括:查询所述待处理信息中的至少一条待处理语句,所述待处理语句为缺少主体名称词条的语句;对于所述至少一条待处理语句中的待处理语句,根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,得到修正后的更新待处理信息。4.根据权利要求3所述的方法,其中,所述根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,包括:根据该语法关系为该待处理语句添加对应的主体名称词条。5.根据权利要求3所述的方法,其中,所述待处理语句包含主体名称代词,以及所述根据对应该待处理语句的语法关系为该待处理语句增加主体名称词条,包括:根据该语法关系将该待处理语句中的主体名称代词替换为对应的主体名称词条。6.根据权利要求1至5任意一项所述的方法,其中,所述初始信息源主体名称词条通过以下步骤获取:从获取的待处理摘要信息中获取至少一条初始主体名称词条;对于所述至少一条初始主体名称词条中初始主体名称词条,确定该初始主体名称词条在所述待处理摘要信息中出现的次数,并根据该次数为该初始主体名称词条设置初始权值;根据初始权值从所述至少一条初始主体名称词条中确定至少一条初始信息源主体名称词条。7.一种用于更新信息的装置,包括:主体名称词条提取单元,被配置成从待处理信息中获取至少一条主体名称词条;权值设置单元,对于所述至少一条主体名称词条中的主体名称词条,被配置成将该主体名称词条与预先获取的至少一条初始信息源主体名称词条进行匹配,并根据匹配结果为该主体名称词条设置权值,其中,所述初始信息源主体名称词条...

【专利技术属性】
技术研发人员:伍志鹏王志华杨天行
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1