【技术实现步骤摘要】
文本分析方法、装置、电子设备以及存储介质
[0001]本公开涉及人工智能
,尤其涉及深度学习
和自然语言处理
,具体涉及文本分析方法、装置、电子设备、存储介质以及程序产品。
技术介绍
[0002]随着人工智能的兴起,自然语言处理技术成为人工智能领域的一个重要分支。自然语言处理技术的基本任务可以包括:句法分析、语义分析和表达正误分析等。自然语言处理技术应用广泛,例如,可以应用于人机交互场景,也可以应用于文本翻译场景,还可以应用于搜索场景。
技术实现思路
[0003]本公开提供了一种文本分析方法、装置、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面,提供了一种文本分析方法,包括:对待分析文本进行句法分析,得到上述待分析文本的句法树;基于上述句法树,确定上述待分析文本的语法分析结果;对上述待分析文本进行纠错分析,得到上述待分析文本的纠错结果;以及基于上述语法分析结果和上述纠错结果,确定目标分析结果。
[0005]根据本公开的另一方面,提供了一种文本分析装置,包括:第一分析模块,用于对待分析文本进行句法分析,得到上述待分析文本的句法树;第一确定模块,用于基于上述句法树,确定上述待分析文本的语法分析结果;第二分析模块,用于对上述待分析文本进行纠错分析,得到上述待分析文本的纠错结果;以及第二确定模块,用于基于上述语法分析结果和上述纠错结果,确定目标分析结果。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处 ...
【技术保护点】
【技术特征摘要】
1.一种文本分析方法,包括:对待分析文本进行句法分析,得到所述待分析文本的句法树;基于所述句法树,确定所述待分析文本的语法分析结果;对所述待分析文本进行纠错分析,得到所述待分析文本的纠错结果;以及基于所述语法分析结果和所述纠错结果,确定目标分析结果。2.根据权利要求1所述的方法,其中,所述句法树包括多个节点和多个依存边,所述节点用于表征所述待分析文本中的字节信息,所述依存边用于表征两个所述节点之间的依存关系;所述基于所述句法树,确定所述待分析文本的语法分析结果,包括:从所述多个依存边中确定符合目标依存关系的目标依存边;基于所述目标依存边,从所述多个节点中确定用于表征预定词性的第一目标节点;以及基于所述第一目标节点,确定所述待分析文本的语法分析结果。3.根据权利要求2所述的方法,其中,所述语法分析结果包括以下至少一项:时态结果、语态结果、语句类型结果;所述第一目标节点为用于表征谓语词性的节点;所述基于所述第一目标节点,确定所述待分析文本的语法分析结果,包括:基于所述第一目标节点,确定所述第一目标节点的词尾形式;在确定所述第一目标节点的词尾形式与预定词尾形式相符的情况下,从多个第二节点中确定与所述第一目标节点相关的第二目标节点,其中,所述多个第二节点包括所述多个节点中除所述第一目标节点外的节点;以及基于所述第二目标节点和所述第一目标节点,确定所述待分析文本的语法分析结果。4.根据权利要求1所述的方法,其中,所述语法分析结果包括句式分析结果;所述基于所述句法树,确定所述待分析文本的语法分析结果,包括:基于所述句法树中的多个节点,从所述多个节点中确定用于表征引导词的第三目标节点;基于所述第三目标节点,从所述待分析文本中确定与所述第三目标节点相关联的目标语句;以及基于所述第三目标节点和所述目标语句,确定所述语法分析结果。5.根据权利要求4所述的方法,其中,所述语法分析结果包括句式类别结果;所述基于所述句法树,确定所述待分析文本的语法分析结果,还包括:在确定所述待分析文本中存在所述目标语句的情况下,对所述待分析文本进行从句类别识别处理,得到关于所述目标语句的句式类别结果的所述语法分析结果。6.根据权利要求2所述的方法,其中,所述基于所述目标依存边,从所述多个节点中确定用于表征预定词性的第一目标节点,包括:基于所述目标依存边,从所述多个节点中确定用于表征预定词性的多个初始第一目标节点;针对所述多个初始第一目标节点中的每个初始第一目标节点,确定所述初始第一目标节点与相邻节点之间的语法关系,得到多个语法关系,其中,所述相邻节点为与所述初始第一目标节点相邻的节点;以及
基于所述多个语法关系,从所述多个初始第一目标节点中确定所述第一目标节点。7.根据权利要求1至6中任一项所述的方法,其中,所述对所述待分析文本进行纠错分析,得到所述待分析文本的纠错结果,包括:对所述待分析文本进行识别,得到纠错识别结果;在基于所述纠错识别结果,确定所述待分析文本中存在错误字节的情况下,基于所述纠错识别结果,将所述错误字节进行更正,得到与所述错误字节相对应的正确字节;以及基于所述正确字节和所述纠错识别结果,确定所述纠错结果。8.根据权利要求7所述的方法,其中,所述基于所述语法分析结果和所述纠错识别结果,确定目标分析结果,包括:在基于所述纠错识别结果,确定所述待分析文本中存在错误字节的情况下,基于所述纠错识别结果,将所述错误字节进行更正,得到与所述错误字节相对应的正确字节;利用所述正确字节,对所述语法分析结果进行更新,得到更新后的语法分析结果;以及基于所述更新后的语法分析结果、所述正确字节和所述纠错识别结果,确定所述目标分析结果。9.根据权利要求1所述的方法,其中,所述对待分析文本进行句法分析,得到所述待分析文本的句法树,包括:对所述待分析文本进行处理,得到关于所述待分析文本的第一矩阵和第二矩阵,其中,所述第一矩阵用于表征多个节点彼此之间是否存在依存关系,所述第二矩阵用于表征所述多个节点彼此之间的依存关系类别;以及对所述第一矩阵和所述第二矩阵进行句法解析,得到所述句法树。10.根据权利要求1所述的方法,还包括:对接收到的图像进行目标识别,得到所述待分析文本;在显示界面显示所述待分析文本;以及响应于用于对待分析文本进行分析的请求,在所述显示界面上显示所述目标分析结果。11.一种文本分析装置,包括:第一分析模块,用于对待分析文本进行句法分析,得到所述待分析文本的句法树;第一确定模块,用于基于所述句法树,确定所述待分析文本的语法分析结果;第二分析模块,用于对所述待分析文本进行纠错分析,得到所述待分析文本的纠错结果;以及第二确定模块,用于基于所述语法分析结果和所述纠错结果,确定目标分析结果。12.根据权利要求11所述的装置...
【专利技术属性】
技术研发人员:雷海东,张帅,陈益,赵娜,张蕾,杨娜,万星,王丽杰,徐梓翔,刘继强,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。