【技术实现步骤摘要】
信息处理方法和装置、电子设备以及计算机可读存储介质
[0001]本申请涉及信息处理
,尤其涉及一种信息处理方法和装置、电子设备以及计算机可读存储介质。
技术介绍
[0002]随着互联网技术的发展,能够通过网络存储大量的信息和资源,从而为用户提供更多的服务。例如,用户可以通过搜索引擎在网络上查找各种信息。特别是近年来,很多互联网平台能够通过对互联网上的信息的整理来为用户提供更近一步的信息服务。例如,知识图谱(Knowledge Graph)可以用于描述实体(Entity)与实体之间的关系,并且因为具有很强的信息整合和检索性能而在互联网上得到了广泛的应用。例如,目前互联网上为用户提供的翻译服务就可以利用该知识图谱来为用户提供不同语言的翻译参考。特别是,用户输入的文本中会常常包含各种与实体相关的专有词语,而互联网上的翻译引擎则可以通过对于用户输入的文本中的相关描述来确定其与整理好的信息数据,例如知识图谱中的实体的关联性。即,将用户输入的文本链接到知识图谱对应的信息数据。因此,在现有技术中,需要一种能够高效地将文本信息链接到知 ...
【技术保护点】
【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获得待处理文本,所述待处理文本中包括目标实体;根据所述目标实体的实体信息,在预设的知识图谱中获得对应的多个实体描述信息;对所述实体信息进行编码得到实体信息向量,以及,对所述多个实体描述信息进行编码得到多个实体描述信息向量;计算所述实体信息向量与每一个实体描述信息向量之间的相似度;根据所述相似度确定与所述目标实体相匹配的图谱实体。2.根据权利要求1所述的信息处理方法,其特征在于,所述预设的知识图谱中包括:多条图谱信息;每一条图谱信息包括图谱实体及其对应的一个或多个图谱实体描述信息。3.根据权利要求1所述的信息处理方法,其特征在于,所述对所述实体信息进行编码得到实体信息向量,包括:对所述实体信息进行多语言词嵌入处理,生成所述实体信息中包含的各个词的词向量;对所述词向量进行融合处理,生成所述实体信息向量。4.根据权利要求1所述的信息处理方法,其特征在于,所述对所述多个实体描述信息进行编码得到多个实体描述信息向量,包括:对一个实体描述信息进行多语言词嵌入处理,生成所述实体描述信息中包含的各个词的词向量;对所述词向量进行融合处理,生成所述实体描述信息向量。5.根据权利要求3或4所述的信息处理方法,其特征在于,所述多语言词嵌入处理,包括:将由其中的各个词组成的变长序列映射为固定大小的词嵌入向量。6.根据权利要求3或4所述的信息处理方法,其特征在于,所述融合处理包括:使用时间维平均池化分别对词向量进行融合处理。7.根据权利要求1所述的信息处理方法,其特征在于,所述信息处理方法进一步包括:将所述实体信息的实体信息向量和所述实体描述信息的实体描述向量进行拼接,以形成用于进行模型训练的拼接向量;利用具有整流线性单元的前馈神经网络基于所述拼接向量进行模型参数的学习。8.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述相似度确定与所述目标实体匹配的图谱实体包括:对所述相似度进行排序,并根据排序结果选择与所述实体信息向量具有最大相似度的实体描述信息所对应于的图谱实体作为与所述目标实体匹配的图谱实体。9.一种信息处理装置,其特征在于,包括:第一获取模块,用于获取待处理文本,所述待处理文本中包括目标实体;第二获取模块,用于根据所述目标实体的实体信息,在预设的知识图谱中获得对应的多个实体描述信息;编码模块,用于对所述实体信息进行编码得到...
【专利技术属性】
技术研发人员:扈中凯,杨海宏,赵宇,骆卫华,施杨斌,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。