人物描写语句的识别方法技术

技术编号:39829419 阅读:5 留言:0更新日期:2023-12-29 16:06
本公开提供一种人物描写语句的识别方法

【技术实现步骤摘要】
人物描写语句的识别方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能和自然语言处理
,尤其涉及一种人物描写语句的识别方法

装置

电子设备及存储介质


技术介绍

[0002]人物描写识别在机器翻译

智能问答

智能客服

智能写作等应用领域起到了重要作用

[0003]目前,通常采用将整篇文章输入大语言模型
(Large Language Model

LLM)
进行人物描写识别的方式,来识别出文章中包含的人物描写语句

然而,在文章包含的内容较多的情况下,上述识别方式会存在识别准确率低

识别速度慢的问题,导致现有的识别方式在实际应用中存在较大的局限性


技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种人物描写语句的识别方法

装置

电子设备及存储介质

[0005]根据本公开的一方面,提供了一种人物描写语句的识别方法,包括:
[0006]获取待识别文本中的描述语句;
[0007]对所述描述语句进行分词处理和词性标注,得到所述描述语句中每个分词对应的词性标注结果;
[0008]基于所述词性标注结果,确定所述描述语句中被标注预设词性的目标分词;
[0009]基于所述目标分词和预先训练的大语言模型,识别所述描述语句是否为人物描写语句

[0010]根据本公开的另一方面,提供了一种人物描写语句的识别装置,包括:
[0011]语句获取模块,用于获取待识别文本中的描述语句;
[0012]分词标注模块,用于对所述描述语句进行分词处理和词性标注,得到所述描述语句中每个分词对应的词性标注结果;
[0013]分词确定模块,用于基于所述词性标注结果,确定所述描述语句中被标注预设词性的目标分词;
[0014]识别模块,用于基于所述目标分词和预先训练的大语言模型,识别所述描述语句是否为人物描写语句

[0015]根据本公开的另一方面,提供了一种电子设备,包括:
[0016]处理器;以及
[0017]存储程序的存储器,
[0018]其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据前述一方面所述的人物描写语句的识别方法

[0019]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,其中,所述计算机指令用于使所述计算机执行根据前述一方面所述的人物描写语句的识别方法

[0020]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现前述一方面所述的人物描写语句的识别方法

[0021]本公开实施例中提供的一个或多个技术方案,通过获取待识别文本中的描述语句,对描述语句进行分词处理和词性标注,得到描述语句中每个分词对应的词性标注结果,并基于词性标注结果,确定描述语句中被标注预设词性的目标分词,进而基于目标分词和预先训练的大语言模型,识别描述语句是否为人物描写语句

采用本公开的方案,通过提取出描述语句中包含的预设词性的目标分词,基于目标分词和大语言模型识别人物描写语句,由此,无需将整个文本输入大语言模型进行识别,避免了因输入内容较多导致识别准确率低和识别速度慢的问题,从而提高了人物描写识别的准确率和识别速度

附图说明
[0022]在下面结合附图对于示例性实施例的描述中,本公开的更多细节

特征和优点被公开,在附图中:
[0023]图1示出了根据本公开一示例性实施例的人物描写语句的识别方法的流程图;
[0024]图2示出了根据本公开另一示例性实施例的人物描写语句的识别方法的流程图;
[0025]图3示出了根据本公开又一示例性实施例的人物描写语句的识别方法的流程图;
[0026]图4示出了根据本公开再一示例性实施例的人物描写语句的识别方法的流程图;
[0027]图5示出了根据本公开示例性实施例的人物描写语句的识别装置的示意性框图;
[0028]图6示出了能够用于实现本公开的实施例的示例性电子设备的结构框图

具体实施方式
[0029]下面将参照附图更详细地描述本公开的实施例

虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开

应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围

[0030]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和
/
或并行执行

此外,方法实施方式可以包括附加的步骤和
/
或省略执行示出的步骤

本公开的范围在此方面不受限制

[0031]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。
术语“基于”是“至少部分地基于”。
术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。
其他术语的相关定义将在下文描述中给出

需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置

模块或单元进行区分,并非用于限定这些装置

模块或单元所执行的功能的顺序或者相互依存关系

[0032]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0033]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性
的目的,而并不是用于对这些消息或信息的范围进行限制

[0034]以下参照附图描述本公开提供的人物描写语句的识别方法

装置

电子设备及存储介质

[0035]现有的人物描写识别方式,通过将整篇文章
(
例如作文
)
直接输入预先训练的
LLM
模型进行人物描写的判断来实现,存在以下问题:
[0036](1)
准确率低:在文章内容较多的情况下,识别准确的概率很低,大约只有
50

60
%,这是因为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种人物描写语句的识别方法,其中,所述方法包括:获取待识别文本中的描述语句;对所述描述语句进行分词处理和词性标注,得到所述描述语句中每个分词对应的词性标注结果;基于所述词性标注结果,确定所述描述语句中被标注预设词性的目标分词;基于所述目标分词和预先训练的大语言模型,识别所述描述语句是否为人物描写语句
。2.
如权利要求1所述的人物描写语句的识别方法,其中,所述预设词性包括动词,所述大语言模型包括动词分类模型;所述基于所述目标分词和预先训练的大语言模型,识别所述描述语句是否为人物描写语句,包括:基于所述目标分词中每个分词对应的词性标注结果,统计所述目标分词中包含的目标动词的第一个数;响应于所述第一个数不小于动词数量阈值,将所述目标动词输入所述动词分类模型,获取每个所述目标动词分别对应的动词类别;基于所述每个目标动词分别对应的动词类别,统计所述目标动词中包含的人类行为动词的第二个数;响应于所述第二个数不小于所述动词数量阈值,确定所述描述语句属于人物动作描写语句
。3.
如权利要求2所述的人物描写语句的识别方法,其中,所述方法还包括:将所述描述语句切分为子句;统计所述描述语句中包含的所述子句的第三个数;对所述第三个数与第一预设值的乘积进行向上取整,得到候选阈值,所述第一预设值为小于1的正数;根据所述候选阈值,确定所述动词数量阈值
。4.
如权利要求3所述的人物描写语句的识别方法,其中,所述根据所述候选阈值,确定所述动词数量阈值,包括:将所述候选阈值与第二预设值进行比较,所述第二预设值为大于1的正整数;响应于所述候选阈值大于所述第二预设值,将所述候选阈值确定为所述动词数量阈值;响应于所述候选阈值不大于所述第二预设值,将所述第二预设值确定为所述动词数量阈值
。5.
如权利要求2‑4任一项所述的人物描写语句的识别方法,其中,所述将所述目标动词输入所述动词分类模型,获取每个所述目标动词分别对应的动词类别,包括:基于所述目标动词和预设的动词识别提示模板,生成动词识别提示文件,所述动词识别提示模板包括识别目标提示

识别步骤提示

识别结果输出格式;将所述动词识别提示文件输入所述动词分类模型,以使所述动词分类模型基于所述动词识别提示文件对所述目标动词进行动词分类;获取所述动词分类模型按照所述识别结果输出格式输出...

【专利技术属性】
技术研发人员:王新
申请(专利权)人:北京新唐思创教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1