【技术实现步骤摘要】
隐喻识别方法、电子设备、计算机可读存储介质
[0001]本申请涉及自然语言处理
,特别涉及一种隐喻识别方法、电子设备和计算机可读存储介质。
技术介绍
[0002]在中文的修辞手法中,隐喻修辞手法是一种用本质上不同但又在某些方面有相似点的一种事物暗喻另一种事物,如“A是B的助推器”这样的语句,对于设备而言,识别隐喻关系的存在是一个较难的任务,而提示学习方法,则可以依靠提示模板来引导模型训练从而发现语句中的隐喻关系。但是,在提示学习实践中,需要根据不同的任务来实现不同的提示模板,从而引导尽可能发挥其价值。但现有提示学习技术在面临具体任务时,如何设置有效提示模板仍然是一个难题,因为人工设置的提示模板虽然简单,但效果有限。因此,如何自动生成提示模板从而引导模型发现语句中的隐喻关系是一个亟待解决的难题。
技术实现思路
[0003]本申请实施例的主要目的在于提出一种隐喻识别方法、电子设备和计算机可读存储介质,可以自动生成提示模板引导模型学习,从而提高语句中的隐喻词发现效率。
[0004]本申请实施例的第一方 ...
【技术保护点】
【技术特征摘要】
1.一种隐喻识别方法,其特征在于,所述方法包括:生成提示语句,其中,所述提示语句包括样本语句、特征词和标识符;将所述样本语句的部分字符和所述特征词中的部分字符,分别替换为虚拟字符;分别确定所述提示语句中每个字符对应的字符嵌入向量,其中,所述虚拟字符的字符嵌入向量为随机向量;根据所有所述字符嵌入向量确定所述提示语句的第一输入向量;通过所述第一输入向量对预设语言模型进行训练,其中,所述预设语言模型用于根据所述第一输入向量预测所述标识符的取值;将获取到的待识别语句输入到预训练的所述预设语言模型进行识别,得到所述待识别语句中的目标标识符的取值。2.根据权利要求1所述的方法,其特征在于,所述生成提示语句包括:构建原始提示模板;获取所述样本语句;从所述样本语句中提取所述特征词;将所述样本语句和所述特征词嵌入所述原始提示模板得到所述提示语句。3.根据权利要求1所述的方法,所述标识符将所述提示语句分为第一部分和第二部分,其特征在于,所述将所述样本语句的部分字符和所述特征词中的部分字符,包括:获取第一隐喻模式的数量、第二隐喻模式的数量和第三隐喻模式的数量并确定隐喻模式总数;获取所述提示语句中第一部分的字符数和第二部分的字符数;根据所述第一隐喻模式的数量、所述第二隐喻模式的数量和所述第三隐喻模式的数量中的至少一个、所述隐喻模式总数和所述第一部分的字符数,从所述样本语句中确定替换为所述虚拟字符的第一字符;根据所述第一隐喻模式的数量、所述第二隐喻模式的数量和所述第三隐喻模式的数量中的至少一个、所述隐喻模式总数和所述第二部分的字符数,从所述特征词中确定替换为所述虚拟字符的第二字符;将所述第一字符和所述第二字符替换为虚拟字符。4.根据权利要求1所述的方法,其中,所述提示语句中的多个字符依次排列,其特征在于,所述分别确定所述提示语句中每个字符对应的字符嵌入向量,包括:随机设置所有所述虚拟字符的初始字符嵌入向量;对所述提示语句中处于第i个字符位置的虚拟字符,确定第一均值向量和第二均值向量,其中,所述第一均值向量为所述提示语句中前i个字符的所述字符嵌入向量的平均值,所述第二均值向量为所述提示语句中从第i个字符开始后续所有字符的所述字符嵌入向量的平均值,其中,i为大于等于1的正整数;根据所述第一均值向量和所述第二均值向量分别得到对应的...
【专利技术属性】
技术研发人员:王伟,李国辉,刘成,陈水辉,蔡鑫,林雪珊,王挺蔡,江有亮,
申请(专利权)人:华润数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。