一种基于概念隐喻理论的隐喻生成方法及系统技术方案

技术编号:37806746 阅读:25 留言:0更新日期:2023-06-09 09:36
本发明专利技术提供一种基于概念隐喻理论的隐喻生成方法及系统,涉及自然语言处理技术领域,包括:采集文本构建隐喻生成语料库,包括成对存在的隐喻句和非隐喻句;获取隐喻词和平替词的义原,分别作为源域和目标域;构建源域

【技术实现步骤摘要】
一种基于概念隐喻理论的隐喻生成方法及系统


[0001]本专利技术涉及自然语言处理
,尤其是涉及一种基于概念隐喻理论的隐喻生成方法及系统。

技术介绍

[0002]概念是人们进行抽象思维的基本元素,人们的推理、想象等心理活动必须通过借助于对概念的加工而进行。语言作为思维交流的重要工具,对概念进行修辞加工是一种常见的语言现象。其中,概念的隐喻化一直是语言学研究中的重要问题。隐喻是指一个认知域中的概念系统地用于对另外一个认知域中的概念进行表达,这种表达在大多数情况下是自动化的、不被人所意识到的,甚至很多情况下,隐喻化的表达已成为了词的本义,只有通过隐喻,人们才能表达这些概念,如山“脚”(身体范畴表达地理概念)、“重”要(知觉范畴表达价值概念)、贬“低”(空间范畴表达情感概念)。针对隐喻现象的解释,传统语义学把隐喻看作是词义的替代或变换,这种观点局限于仅从语言的角度看待隐喻。
[0003]现代认知理论的出现使研究者开始从认知机制对隐喻现象进行分析,概念隐喻理论得以提出。概念隐喻理论认为隐喻是人们借助具体的、有形的、简单的源域概念(如温度、空本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于概念隐喻理论的隐喻生成方法,其特征在于,包括:采集文本,构建隐喻生成语料库,包括:成对存在的隐喻句和非隐喻句;获取各隐喻句中隐喻词的义原作为源域,获取各非隐喻句中平替词的义原作为目标域;基于所有所述源域和目标域构建具有概率标签的源域

目标域映射表;基于成对存在的隐喻句和非隐喻句,以各非隐喻句为基础,结合所述源域

目标域映射表构造隐喻模型的输入,将对应的隐喻句作为对应的输出,训练并获得隐喻模型;对需生成隐喻的非隐喻句,获取该非隐喻句中动词的义原得到目标域;基于所述源域

目标域映射表,得到该目标域的所有映射及各映射的概率标签,根据所述概率标签抽样得到一个目标域

源域映射关系;基于该非隐喻句及该目标域

源域映射关系构造隐喻模型的输入,输入所述隐喻模型,所述隐喻模型自回归生成动词性隐喻句。2.根据权利要求1所述的基于概念隐喻理论的隐喻生成方法,其特征在于:所述构建隐喻生成语料库,包括:采集富含修辞手法的各种文本类型的文本,来源包括:互联网、现有语料库和书籍资料;对文本依次进行筛选、预处理,得到可利用的文本;对可利用的文本进行标准化隐喻识别程序处理,使文本中每一个词都标注有隐喻标签,隐喻标签包括0和1,0表示无隐喻,1表示隐喻;对标注后的文本中每个标签为1的词,寻找对应的无隐喻的平替词;使用各平替词替换对应隐喻词得到各非隐喻句;各非隐喻句与未替换隐喻词的各原隐喻句成对保存,得到隐喻生成语料库。3.根据权利要求1所述的基于概念隐喻理论的隐喻生成方法,其特征在于:所述基于所有所述源域和目标域构建具有概率标签的源域

目标域映射表;包括:基于隐喻词和平替词的对应关系,将各隐喻词的义原与对应的各平替词的义原对应起来,得到源域

目标域映射关系;将所有的源域

目标域映射关系计入同一表中,并根据各源域

目标域映射关系出现的频率得到其概率标签,得到具有概率标签的源域

目标域映射表。4.根据权利要求1所述的基于概念隐喻理论的隐喻生成方法,其特征在于:基于成对存在的隐喻句和非隐喻句,以各非隐喻句为基础,结合所述源域

目标域映射表构造隐喻模型的输入,包括:基于非隐喻句中的平替词的义原,随机获取一个源域

目标域映射关系,基于该源域

目标域映射关系得到隐喻词的义原;将隐喻词的义原放于非隐喻句的句首,并设置分隔符与该非隐喻句隔开;将平替词的义原接于非隐喻句中平替词的后面,并设置连接符与平替词连接;设置标记符,在非隐喻句中的平替词前、平替词义原后分别添加,给隐喻模型标记需要更改的位置,得到隐喻模型的输入。5.根据权利要求1所述的基于概念隐喻理论的隐喻生成方法,其特征在于:训练并获得隐喻模型,包括:
将所述隐喻生成语料库分为训练集和验证集;将训练集中隐喻模型的输入及对应的输出一同输入BART预训练模型,并采用反向传播算法进行训练;通过验证集对各阶段的BART预训练模型进行正确率验证,当正确率不再提高时终止训练,保存模型参数,得到隐喻模型。6.一种基于概念隐喻理论的隐喻生成系统,其特征在于,包括:数据准备模块、模型训练模块、模...

【专利技术属性】
技术研发人员:马任
申请(专利权)人:华院计算技术上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1