语义关系的识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：28978658 阅读：12 留言：0更新日期：2021-06-23 09:24

本申请实施例提供了一种语义关系的识别方法、装置、电子设备及可读存储介质，涉及大数据以及云技术领域。该方法包括：获取待处理文本；对待处理文本进行上下文分析，得到待处理文本中包含的语法关系序列；将语法关系序列与特定语义关系的类序列规则库进行匹配，基于匹配结果，确定待处理文本是否包含特定语义关系；其中，类序列规则库中包括特定语义关系对应的语法关系序列规则，语法关系序列规则是通过对包含特定语义关系的多个样本文本进行语法关系的类序列规则挖掘得到的。在本申请实施例中，由于语法关系序列规则是对进行语法关系的类序列规则挖掘得到的，此时不依赖于规则和制定模式，提高了模型识别语义关系的泛化能力，具备良好的可操作性。

全部详细技术资料下载

【技术实现步骤摘要】
语义关系的识别方法、装置、电子设备及可读存储介质
本申请涉及大数据以及云技术的
，具体而言，本申请涉及一种语义关系的识别方法、装置、电子设备及可读存储介质。
技术介绍
随着语言的发展和互联网用语的不断变化衍生，特定语义关系识别对于自然语言理解是个重要的任务，包括知识图谱构建、领域知识库构建、关系链识别、词条标签自动化构建等在内的诸多应用场景都离不开特定语义关系识别。特定语义关系包括上下义关系、总分关系、同义关系、反义关系等，以及从其他逻辑关系定义中的种属关系、组成关系等，涵盖访问很广。目前在进行语义关系识别时，主要采用的方式为基于模式匹配的语义关系识别方法和基于机器学习或深度学习的语义关系识别方法。但是经研究发现，基于模式匹配的语义关系识别方法只能够抽取具有人工指定规则的显示关系，而许多的语义关系隐含模式是灵活变化的，该方法极大降低了关系抽取的覆盖率，同时规则扩展要依赖专家和先验知识库，提高了人力成本和耗时，线上更新不够及时；而基于机器学习的方法主要依赖于特征工程，特征工程往往要进行繁琐的特征选择和特征提取，计算开销大且容易存在错误传播的问题。因此，如何快速有效的进行语义关系识别是一个需要解决的重要问题。
技术实现思路
本申请实施例提供一种语义关系的识别方法、装置、电子设备及可读存储介质，能够快速有效的进行语义关系识别。一方面，本申请实施例提供了一种语义关系的识别方法，该方法包括：获取待处理文本；对待处理文本进行上下文分析，得到待处理文本中包含的语法关系序列；...

【技术保护点】
1.一种语义关系的识别方法，其特征在于，包括：/n获取待处理文本；/n对所述待处理文本进行上下文分析，得到所述待处理文本中包含的语法关系序列；/n将所述语法关系序列与特定语义关系的类序列规则库进行匹配，基于匹配结果，确定所述待处理文本是否包含所述特定语义关系；/n其中，所述类序列规则库中包括所述特定语义关系对应的语法关系序列规则，所述语法关系序列规则是通过对包含所述特定语义关系的多个样本文本进行语法关系的类序列规则挖掘得到的。/n

【技术特征摘要】
1.一种语义关系的识别方法，其特征在于，包括：
获取待处理文本；
对所述待处理文本进行上下文分析，得到所述待处理文本中包含的语法关系序列；
将所述语法关系序列与特定语义关系的类序列规则库进行匹配，基于匹配结果，确定所述待处理文本是否包含所述特定语义关系；
其中，所述类序列规则库中包括所述特定语义关系对应的语法关系序列规则，所述语法关系序列规则是通过对包含所述特定语义关系的多个样本文本进行语法关系的类序列规则挖掘得到的。

2.根据权利要求1所述方法，其特征在于，所述类序列规则库中包括词性关系序列规则、句法关系序列规则或语义关系序列规则中的至少一种，所述语法关系序列包括所述词性关系序列、句法关系序列或语义关系序列中的至少一种；
所述对所述待处理文本进行上下文分析，得到所述待处理文本中包含的语法关系序列，包括以下至少一项：
对所述待处理文本进行分词，对得到的分词结果中的各词进行词性标注，并基于所述各词的上下文关系，得到所述待处理文本对应的词性关系序列；
对所述待处理文本进行句法依存分析，得到所述待处理文本对应的句法关系序列；
对所述待处理文本进行语义依存分析，得到所述待处理文本对应的语义关系序列。

3.根据权利要求2所述方法，其特征在于，所述将所述语法关系序列与特定语义关系的类序列规则库进行匹配，基于匹配结果，确定所述待处理文本是否包含所述特定语义关系，包括：
将所述语法关系序列中的各序列与所述类序列规则库中对应的语法关系序列规则分别进行匹配，若所述语法关系序列中至少一种序列与所述类序列规则库相对应的语法关系序列规则匹配，则确定所述待处理文本含所述特定语义关系。

4.根据权利要求3所述方法，其特征在于，对于所述类序列规则库中的任一语法关系序列规则，若所述语法关系序列规则包括至少两个规则，所述将所述语法关系序列中的各序列与所述类序列规则库中对应的语法关系序列规则分别进行匹配，包括：
对于包含至少两个规则的所述语法关系序列规则，将所述语法关系序列中该语法关系序列规则对应的序列分别与所述至少两个规则进行匹配，若该序列与所述至少两个规则中的任一规则匹配，则确定该序列与该语法关系序列规则匹配。

5.根据权利要求1至4中任一项所述方法，其特征在于，所述语法关系序列规则所包含的每个规则还带有标注信息，对于任一规则，所述标注信息表征了所述特定语义关系在该规则中对应的位置信息；
所述方法还包括：
若确定所述待处理文本中包含所述特定语义关系，根据所述语法关系序列规则中与所述语法关系序列相匹配的规则中的标注信息，...

【专利技术属性】
技术研发人员：刘志煌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人