【技术实现步骤摘要】
用于确定术语关系的方法、装置、电子设备、介质
[0001]本公开涉及数据处理与人工智能
,尤其涉及自然语言处理和知识图谱,具体涉及一种用于确定术语关系的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]术语的关系挖掘技术可以用于术语体系的构建,对知识图谱构建具有重要意义。通过术语关系挖掘技术可以使得构建出来的知识图谱具有更丰富的层次化信息,有助于辅助下游的问答及精细化检索任务。
[0003]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分 ...
【技术保护点】
【技术特征摘要】
1.一种计算机执行的用于确定术语关系的方法,包括:获得多个分词,所述多个分词是对来自语料库的第一术语进行分词处理而获得的;确定所述多个分词之间的一个或多个依赖关系;基于所述一个或多个依赖关系中的至少一个依赖关系,根据所述多个分词中的至少两个分词构造第二术语;以及响应于确定所述第二术语在所述语料库中,将所述第二术语确定为所述第一术语的下位概念。2.根据权利要求1所述的方法,其中,基于所述一个或多个依赖关系中的至少一个依赖关系,根据所述多个分词中的至少两个分词构造第二术语包括:删除所述第一术语中的具有所述至少一个依赖关系的至少两个分词,以形成所述第二术语。3.根据权利要求1或2所述的方法,其中,基于所述一个或多个依赖关系中的至少一个依赖关系,根据所述多个分词中的至少两个分词构造第二术语包括:对所述第一术语中的、与同一分词具有所述至少一个依赖关系的至少两个分词的顺序进行调整,以形成所述第二术语。4.根据权利要求1
‑
3中任一项所述的方法,其中,确定所述多个分词之间的一个或多个依赖关系包括:确定所述多个分词中的至少一个修饰词和至少一个核心词;以及基于所述至少一个修饰词与所述至少一个核心词确定一个或多个修饰关系。5.根据权利要求4所述的方法,其中,确定所述多个分词中的至少一个修饰词和至少一个核心词包括:基于所述多个分词中的每个分词在所述语料库中的多个术语中的出现位置和出现频率,确定所述多个分词中的每个分词是核心词的概率;以及基于所述概率,从所述多个分词中确定所述至少一个修饰词和所述至少一个核心词。6.根据权利要求4或5所述的方法,其中,基于所述至少一个修饰词与所述至少一个核心词确定一个或多个修饰关系包括:针对所述多个分词中的每个分词,基于所述语料库,确定该分词与所述多个分词中的紧邻分词的共现频率;以及基于所述共现频率确定所述一个或多个修饰关系。7.根据权利要求6所述的方法,其中,基于所述共现频率确定所述一个或多个修饰关系包括:对于所述多个分词中的、所确定的至少一个修饰词,基于所述共现频率确定其所修饰的词。8.根据权利要求1
‑
7任一项所述的方法,还包括:响应于确定所述第二术语不在所述语料库中,删除所述至少一个依赖关系。9.根据权利要求1
‑
8任一项所述的方法,其中,所述语料库是电力行业语料库。10.一种计算机执行的用于确定术语关系的装置,包括:分词获得单元,用于获得多个分词,所述多个分词是对来自语料库的第一术语进行分词处理而获得的;依赖关系确定单元,用于确定所述多个分词之间的一个或多个依赖关系;
术语构造单元,用于基于所述...
【专利技术属性】
技术研发人员:章玥,史亚冰,蒋烨,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。