【技术实现步骤摘要】
实体链指模型的训练及实体链指方法、装置、设备及介质
[0001]本公开涉及人工智能
,具体涉及深度学习和知识图谱
,可应用于实体链指场景。
技术介绍
[0002]为了能够帮助用户更好的理解文本资源,也可以根据用户的意图更好的推荐符合用户需求的文本资源等,需要识别文本中的实体提及来进行实体链指(Entity Linking)或者称为实体链接。其中,实体链指是指将文本中的实体提及链接到知识库中的实体的描述信息。
技术实现思路
[0003]本公开提供了一种实体链指模型的训练及实体链指方法、装置、设备及介质。
[0004]根据本公开的一方面,提供了一种实体链指模型的训练方法,该方法包括:
[0005]根据源域标注文本中的实体提及,从源域知识库和目标域知识库中选择所述实体提及的正实例描述信息和负实例描述信息;
[0006]将所述源域标注文本和所述正实例描述信息,作为第一正样本;
[0007]将所述源域标注文本和所述负实例描述信息,作为第一负样本;
[0008]采用所述 ...
【技术保护点】
【技术特征摘要】
1.一种实体链指模型的训练方法,包括:根据源域标注文本中的实体提及,从源域知识库和目标域知识库中选择所述实体提及的正实例描述信息和负实例描述信息;将所述源域标注文本和所述正实例描述信息,作为第一正样本;将所述源域标注文本和所述负实例描述信息,作为第一负样本;采用所述第一正样本、所述第一负样本、以及样本监督数据对实体链指模型进行有监督训练。2.根据权利要求1所述的方法,其中,所述根据源域标注文本中的实体提及,从源域知识库和目标域知识库中选择所述实体提及的正实例描述信息和负实例描述信息,包括:将所述源域知识库中与所述源域标注文本中实体提及关联的描述信息,作为关联描述信息;根据所述实体提及的实体信息,从所述关联描述信息中选择正实例描述信息,以及负实例描述信息中的第一描述信息;将所述目标域知识库中与所述实体提及关联的描述信息,作为所述负实例描述信息中的第二描述信息。3.根据权利要求1所述的方法,还包括:从所述目标域知识库和/或目标域无标注文本中抽取至少两个目标文本数据;根据所述至少两个目标文本数据,生成第二正样本和第二负样本;采用所述第二正样本和所述第二负样本,对有监督训练后的实体链指模型进行无监督训练。4.根据权利要求3所述的方法,其中,所述根据所述至少两个目标文本数据,生成第二正样本和第二负样本,包括:对所述至少两个目标文本数据进行复制,得到至少两个复制文本数据;将目标文本数据和目标文本数据的复制文本数据的组合作为第二正样本,以及将不同目标文本数据间的组合作为第二负样本。5.一种实体链指方法,包括:对目标文本中的实体提及进行标注;将标注后的目标文本输入至实体链指模型,得到从目标域知识库中选择的所述实体提及的描述信息;其中,所述实体链指模型根据权利要求1至4中任一所述的方法训练得到。6.一种实体链指模型的训练装置,包括:实例描述信息选择模块,用于根据源域标注文本中的实体提及,从源域知识库和目标域知识库中选择所述实体提及的正实例描述信息和负实例描述信息;第一正样本确定模块,用于将所述源域标注文本和所述正实例描述信息,作为第一正样本;第一负样本确定模块,用于将所述源域标注文本和所述负实例描述信息,作为第一负样本;有监督训练模块,用于采用所述第一正样本、所述第一负样本、以及样本监督数据对实体链指模型进行有监督训练。
7.根据权利要求6所述的装置,...
【专利技术属性】
技术研发人员:常万里,王述,刘同阳,冯知凡,柴春光,朱勇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。