【技术实现步骤摘要】
语义缺失的识别方法及装置、电子设备、存储介质
本申请涉及数据处理
,特别涉及一种语义缺失的识别方法及装置、电子设备、计算机可读存储介质。
技术介绍
多轮会话场景下,用户的话语会由于简洁表达的需要而出现指代或信息省略(即语义缺失)的现象,这使得用户的话语不再是信息完整的,与对话语语境产生了较为强烈的依赖。这样的现象给对话系统的语义理解能力带来了巨大的挑战。因此,如何充分利用对话上下文来增强对话系统的语义理解能力是亟需解决的问题。对话改写是一种利用对话上下文来增强对话系统的语义理解能力的技术方法。它利用对话上下文对用户话语进行改写,完成对指代情况进行消解,对信息省略进行补全,从而恢复用户话语的语义完整性。对话改写可以进一步细分为“改写识别”和“文本改写”两个子问题。“改写识别”用于判断用户话语是否需要改写,“文本改写”用于对需要改写的话语进行改写。当对话改写能准确区分用户话语是否需要改写,以及对需要改写的话语进行正确的改写时,用户话语的语义完整才能得到恢复,对话系统的语义理解能力才能得到提高。目前提供了一种 ...
【技术保护点】
1.一种语义缺失的识别方法,其特征在于,包括:/n对待识别语料进行分词处理,并提取不同词汇的词性信息以及不同词汇之间的依存关系信息;/n根据所述词性信息和依存关系信息,确定是否存在指代现象以及成分省略;/n根据所述待识别语料以及所述待识别语料的上下文获得缺失判别结果;/n根据是否存在指代现象、成分省略以及所述缺失判别结果,综合确定所述待识别语料是否存在语义缺失。/n
【技术特征摘要】
1.一种语义缺失的识别方法,其特征在于,包括:
对待识别语料进行分词处理,并提取不同词汇的词性信息以及不同词汇之间的依存关系信息;
根据所述词性信息和依存关系信息,确定是否存在指代现象以及成分省略;
根据所述待识别语料以及所述待识别语料的上下文获得缺失判别结果;
根据是否存在指代现象、成分省略以及所述缺失判别结果,综合确定所述待识别语料是否存在语义缺失。
2.根据权利要求1所述的方法,其特征在于,所述根据所述词性信息和依存关系信息,确定是否存在指代现象以及成分省略,包括:
根据预先收集的指代词库,采用词匹配的方式判断所述待识别语料是否存在所述指代词库中出现的指代词;
根据不同词汇的词性信息和不同词汇之间的依存关系信息,确定所述指代词是否导致指代现象。
3.根据权利要求2所述的方法,其特征在于,所述根据所述词性信息和依存关系信息,确定是否存在指代现象以及成分省略,包括:
根据所述不同词汇的词性信息,判断所述指代词的词性是否是代词;
若所述指代词的词性是代词,根据所述不同词汇之间的依存关系信息,判断所述指代词是否充当主语或宾语成分;如果是,确定所述指代词导致指代现象。
4.根据权利要求1所述的方法,其特征在于,所述根据所述词性信息和依存关系信息,确定是否存在指代现象以及成分省略,包括:
根据所述不同词汇之间的依存关系信息,判断是否存在主谓关系;
若不存在主谓关系,确定存在主语省略。
5.根据权利要求1所述的方法,其特征在于,所述根据所述词性信息和依存关系信息,确定是否存在指代现象以及成分省略,包括:
根据所述不同词汇之间的依存关系信息,判断是否存在动宾关系;
若不存在动宾关系,根据所述不同词汇的词性信息,判断所述待识别语料是否存在动词;
若不存在动词,确定存在谓语省略;若存在动词,确定存在宾语省略。
6.根据权利要求5所述的方法,其特征在于,所述根据所述不同词汇的词性信息,判断所述待识别语料是否存在动词,包括:
根据所述不同词汇的词性信息以及不同词汇之间的依存关系信息,判断根节点指向的词汇是否是动词。
7.根据权利要求5所述的方法,其特征在于,所述若存在动词,确定存在宾语省略,包括:
若所述动词是不及物动词或者与邻接词构成动补结构或者非邻接动补结构中存在量词充当宾语成分,确定不存在成分省略,否则确定存在宾语省略。
8.根据权利要求1所述的方法,其特征在于,所述根据所述待识别语料以及所述待识别语料的上下文获得缺失判别结果,包括:
将所述待识别语料以及所述待识别语料的上下文作为缺失识别器的输入,获得所述缺失识别器输出的缺失判别结果。
9.根据权利要求8所述的方法,其特征在于,在将所述待识别语料以及所述待识别语料的上下文作为缺失识别器的输入,获...
【专利技术属性】
技术研发人员:黄诗磊,孙振华,张聪,范长杰,胡志鹏,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。