【技术实现步骤摘要】
一种语句分析的方法及装置
本申请涉及自然语言处理
,特别涉及一种语句分析的方法及装置、计算设备和计算机可读存储介质。
技术介绍
自然语言文本的语义分析任务为根据输入语句的句法结构和句子中每个实词的词义进行语义角色标注,标记出一个语句中描述的事件以及与事件相关的各个角色,从而推导出能够反映该语句句义的形式化表示。目前,大多中文句式是以宾州树的形式储存,宾州树保存了语句中每一个词的词性信息和不同词语之间的关系,按照名词性短语、动词性短语等不同类型的短语进行分类,选择核心动词作为root节点,连接语句内的所有词语。由于宾州树对语句中的每一个词都进行连接,导致句式库过于庞大,不方便查询。并且,以核心动词为root节点,使得其无法解析名词性短句。
技术实现思路
有鉴于此,本申请实施例提供了一种语句分析的方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。本申请实施例提供了一种语句分析的方法,包括:对目标语句的每个词单元进行词性标注;基于所述目标语句 ...
【技术保护点】
1.一种语句分析的方法,其特征在于,包括:/n对目标语句的每个词单元进行词性标注;/n基于所述目标语句生成短语,并根据每个所述词单元的词性得到每个短语的句式,其中,所述短语包括至少一个词单元;/n根据所述短语的句式得到所述目标语句的每个子句的句式;/n根据每个所述子句的句式得到所述目标语句的句式。/n
【技术特征摘要】
1.一种语句分析的方法,其特征在于,包括:
对目标语句的每个词单元进行词性标注;
基于所述目标语句生成短语,并根据每个所述词单元的词性得到每个短语的句式,其中,所述短语包括至少一个词单元;
根据所述短语的句式得到所述目标语句的每个子句的句式;
根据每个所述子句的句式得到所述目标语句的句式。
2.如权利要求1所述的方法,其特征在于,对目标语句的每个词单元进行词性标注,包括:
对目标语句进行分词,得到多个所述词单元;
对每个词单元进行词性标注,得到每个词单元对应的词性标签。
3.如权利要求2所述的方法,其特征在于,基于所述目标语句生成短语,包括:对所述目标语句进行短语识别,得到多个所述短语。
4.如权利要求3所述的方法,其特征在于,在所述短语包括一个词单元的情况下;
根据每个所述词单元的词性得到每个短语的句式,包括:将所述短语对应的所述词单元的词性标签作为所述短语的句式;
在所述短语包括至少两个相邻的词单元的情况下;
根据每个所述词单元的词性得到每个短语的句式,包括:将所述短语对应的所述词单元的词性标签进行组合,得到每个短语的句式。
5.如权利要求1所述的方法,其特征在于,根据所述短语的句式得到所述目标语句的每个子句的句式,包括:
根据所述短语的句式,确定所述短语的词性标签;其中,所述短语的词性标签包括名词性标签和动词性标签;
确定词性标签为名词性标签和动词性标签的短语为目标短语,并将所述目标短语的词性标签按顺序组合,得到所述子句的句式,其中,每个子句包括至少一个短语。
6.如权利要求1或5所述的方法,其特征在于,在所述目标语句包括至少两个子句的情况下;
根据每个所述子句的句式得到所述目标语句的句式,包括:根据每个所述子句的句式以及相邻子句之间的标点,生成所述目标语句...
【专利技术属性】
技术研发人员:郭昱,李长亮,汪美玲,
申请(专利权)人:北京金山数字娱乐科技有限公司,成都金山互动娱乐科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。