【技术实现步骤摘要】
文本检测方法及装置
[0001]本公开涉及自然语言处理
,更具体地涉及一种文本检测的方法和装置
。
技术介绍
[0002]面对包含着大量事件信息的复杂数据,如何能通过技术手段快速准确地剖析事件以及事件之间的关系是一项重要课题
。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:传统的基于模板匹配的事理挖掘构建简单,过度依赖模板匹配库
。
传统的机器学习和强化学习方法存在着对初始种子敏感
、
语义漂移
、
训练数据质量要求高等问题
。
另外,传统的方法没有充分挖掘事件间的潜在关系与隐藏关系,针对共现
、
演化关系的分析能力不足
。
技术实现思路
[0004]鉴于上述问题,本公开提供了一种文本检测方法及装置
。
[0005]根据本公开的第一个方面,提供了一种文本检测方法,包括:
[0006]从待检测的文本对中提取第一文本的第一特征词和第二文本 ...
【技术保护点】
【技术特征摘要】
1.
一种文本检测方法,包括:从待检测的文本对中提取第一文本的第一特征词和第二文本的第二特征词,其中,所述第一特征词表征用于触发所述第一文本描述的第一事件的动作特征;所述第二特征词表征用于触发所述第二文本描述的第二事件的动作特征;以及将所述第一特征词和所述第二特征词输入事件共现关系检测模型,得到所述第一事件与所述第二事件的共现关系检测结果
。2.
根据权利要求1所述的方法,其中,所述从待检测的文本对中提取第一文本的第一特征词和第二文本的第二特征词,包括:对所述待检测的文本对分别进行词性识别,得到所述第一文本的词性识别结果和所述第二文本的词性识别结果;基于所述第一文本的词性识别结果,从所述第一文本中提取所述第一特征词;以及基于所述第二文本的词性识别结果,从所述第二文本中提取所述第二特征词
。3.
根据权利要求2所述的方法,其中,所述基于所述第一文本的词性识别结果,从所述第一文本中提取所述第一特征词,包括:基于所述第一文本的词性识别结果,从所述第一文本中提取包括预定词性的特征词的第一目标文本;从所述第一目标文本中提取所述第一特征词;基于所述第二文本的词性识别结果,从所述第二文本中提取包括预定词性的特征词的第二目标文本;以及从所述第二目标文本中提取所述第二特征词
。4.
根据权利要求1所述的方法,其中,所述将所述第一特征词和所述第二特征词输入事件共现关系检测模型,得到所述第一事件与所述第二事件的共现关系检测结果,包括:将所述第一特征词和所述第二特征词输入事件共现关系检测模型,得到所述第一特征词与所述第二特征词同时出现在同一事件中的第一概率;基于所述第一概率,得到所述第一事件与所述第二事件的共现关系检测结果
。5.
根据权利要求1所述的方法,还包括:将所述第一特征词和所述第二特征词输入事件演化关系检测模型,得到所述第一事件与所述第二事件的演化关系检测结果
。6.
根据权利要求5所述的方法,其中,所述将所述第一特征词和所述第二特征词输入事件演化关系检测模型,得到所述第一事件与所述第二事件的演化关系检测结果,包括:将所述第一特征词和所述第二特征词输入事件演化关系检测模型,得到第一特征词衍生出所述第二特征词的第二概率;基于所述第二概率,得到所述第一事件与所述第二事件的演化关系检测结果
。7.
根据权利要求5所述的方法,其中,所述事件共现关系检测模型的构建方法包括:对样本文本...
【专利技术属性】
技术研发人员:金康荣,徐轶,刘欣,屠隽弢,王江,刘午凌,
申请(专利权)人:苏州空天信息研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。