【技术实现步骤摘要】
一种基于词性注意力机制的中文事件探测方法
[0001]本专利技术属于自然语言处理领域,具体涉及一种基于词性注意力机制的中文事件探测方法。
技术介绍
[0002]事件抽取是信息抽取的任务之一,主要任务是从非结构化的文本中抽取结构化的文本信息。事件抽取在日常生活的作用也不可小觑。在金融领域,抽取股市的金融事件能够帮助投资者、企业决策者了解股市变动,做出更加合理的决策。对于政府部门而言,抽取热点新闻事件信息能帮助政府部门做好舆情监督工作,了解热点事件的发展历程。在自然语言处理研究中,事件抽取得到的结构化数据可以用于构建知识图谱,也可用于问答以及信息检索等其他的自然语言处理(neural language process,NLP)任务。根据ACE(Automatic Content Extraction)的会议定义,现有的研究将事件抽取分为四个任务:触发词探测、事件类型或触发词类型识别、事件论元探测以及论元角色分类。
[0003]现有的事件探测方法可以概括为两种:一种引入外部知识库提高模型表现,另一种提供新模型或者改进现有模 ...
【技术保护点】
【技术特征摘要】
1.一种基于词性注意力机制的中文事件探测方法,其特征在于,包括以下步骤:Step1、利用分词工具切分句子,然后使用词性标注工具获取每个词的词性标签,得到词性标签之后使用word2vec方法,得到预训练词性标签向量;Step2、得到句子的词性特征矩阵,使用卷积神经网络提取词性词特征;Step3、利用分词工具切分句子,得到句子的词向量矩阵和字向量矩阵;然后分别在句子的词矩阵和句子矩阵上使用卷积神经网络提取句子中词汇级别特征和字级别特征;Step4、将词汇级别特征和词性注意力点乘,之后将词汇级别特征和上下文词的特征拼接得到新的词汇级别特征;Step5、词汇级别特征和字级别特征拼接后得到作为块提取网络的输入特征,块提取网络输出该词的块分类标签;Step6、使用块提取网络的输出标签和真实标签计算损失,使用Adadelta反向传播优化词卷积网络、字卷积网络、词性注意模块和块提取网络。2.根据权利要求1所述一种基于词性注意力机制的中文事件探测方法,其特征在于,所述Step2中使用卷积核,在词上做卷积计算,抽取词性特征,...
【专利技术属性】
技术研发人员:王红斌,胡庆孟,线岩团,李辉,文永华,
申请(专利权)人:昆明理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。