基于HanLP实时模型的语义解析方法技术

技术编号:36966853 阅读:30 留言:0更新日期:2023-03-22 19:27
本发明专利技术涉及自然语言处理领域,为了提高语义解析正确率,提供了基于HanLP实时模型的语义解析方法,包括:步骤1、基于HanLP建立用于在线学习分词的感知机模型并训练;步骤2、采用感知机模型进行分词;步骤3、依存句法分析;步骤4、当句法分析错误时,对词条进行人工分词,并将分词结果输入感知机模型进行训练;若句法分析正确,则调用语义解析模块进行语义解析。采用上述方式可以提高语义解析正确率。用上述方式可以提高语义解析正确率。用上述方式可以提高语义解析正确率。

【技术实现步骤摘要】
基于HanLP实时模型的语义解析方法


[0001]本专利技术涉及自然语言处理领域,具体是一种基于HanLP实时模型的语义解析方法。

技术介绍

[0002]随着计算机和人工智能的兴起,自然语言处理作为人工智能的一个重要方向,主要研究将自然语言解析为可执行指令问题。自然语言处理按照系统结构和实现技术,大致可以分为以下几种类型:语义算法、语义规则、相似度搜索。目前这几种对于规则的词条解析正确率较高,但对于新词汇、不规则的词条就难以进行解析,从而导致语义解析正确率不高。特别是出现新歌名、新电视剧名、网络热词等情况,大多数都走到闲聊,从而使用户体验非常不好。

技术实现思路

[0003]为了提高语义解析正确率,本申请提供了一种基于HanLP实时模型的语义解析方法。
[0004]本专利技术解决上述问题所采用的技术方案是:
[0005]基于HanLP实时模型的语义解析方法,包括:
[0006]步骤1、基于HanLP建立用于在线学习分词的感知机模型并训练;
[0007]步骤2、采用感知机模型进行分词;
[0008]步骤3、依存句法分析;
[0009]步骤4、当句法分析错误时,对词条进行人工分词,并将分词结果输入感知机模型进行训练;若句法分析正确,则调用语义解析模块进行语义解析。
[0010]进一步地,所述步骤2在进行分词前还包括去除停用词。
[0011]进一步地,去除停用词的词条长度大于预设值。
[0012]进一步地,所述步骤2在进行分词后还包括去除重复数据。
[0013]进一步地,所述步骤2根据词性及词名去除重复数据。
[0014]进一步地,所述步骤3采用NeuralNetworkDependencyParser进行句法分析。
[0015]本专利技术相比于现有技术具有的有益效果是:基于HanLP建立的感知机模型可以实现单条数据在线学习,通过实时训练提高分词准确性,进而提高语义解析正确率。
附图说明
[0016]图1为基于HanLP实时模型的语义解析方法流程图。
具体实施方式
[0017]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0018]如图1所示,基于HanLP实时模型的语义解析方法,包括:
[0019]步骤1、基于HanLP建立用于在线学习分词的感知机模型并训练;
[0020]步骤2、采用感知机模型进行分词;
[0021]步骤3、采用NeuralNetworkDependencyParser进行句法分析;
[0022]步骤4、当句法分析错误时,对词条进行人工分词,并将分词结果输入感知机模型进行训练;若句法分析正确,则调用语义解析模块进行语义解析。
[0023]为了提高分词正确率,所述步骤2在进行分词前还包括去除停用词。停用词指对词条没有实际意义的词,如“小爱同学”作为句子开头,语气词等。本实施例在去除停用词时还设置了词条长度,只有当词条长度大于预设值时才去除停用词,词条长度小于预设值时认为所有字都有意义。
[0024]为了去除干扰,所述步骤2在进行分词后还包括根据词性及词名去除重复数据。
[0025]本申请从语义解析步骤中的分词模型入手,通过对分词模型进行实时训练,通过在线学习提高分词模型的分词准确率,进而提高语义解析正确率。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于HanLP实时模型的语义解析方法,其特征在于,包括:步骤1、基于HanLP建立用于在线学习分词的感知机模型并训练;步骤2、采用感知机模型进行分词;步骤3、依存句法分析;步骤4、当句法分析错误时,对词条进行人工分词,并将分词结果输入感知机模型进行训练;若句法分析正确,则调用语义解析模块进行语义解析。2.根据权利要求1所述的基于HanLP实时模型的语义解析方法,其特征在于,所述步骤2在进行分词前还包括去除停用词。3.根据权利要求2所述的基于HanLP实时模型的语义解析方法,其...

【专利技术属性】
技术研发人员:梁艳
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1