基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质制造方法及图纸

技术编号:23149265 阅读:27 留言:0更新日期:2020-01-18 13:32
本发明专利技术涉及数据处理领域,尤其涉及一种基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质,该方法包括:首先,输入语音并使用jieba分词;然后获取语料并进行预处理;接下来,进行MITIE模型训练,采用MITIE中wordrep这一个工具进行模型训练,得到数据集;最后,构建Rasa_Nlu语料和模型,用于进行意图识别和实体识别,获取用户的意图,本发明专利技术运用当下最新的人工智能领域的自然语言处理技术,能精确的解析用户的意图,并且本发明专利技术计算机场景下基于Rasa_Nlu框架的方法可以提高实体识别率,解决现行方法实体识别率低下的问题,为人们提供了很大的便利。

Methods, devices, systems and storage media for improving entity recognition rate based on rasa \ufe63 NLU framework

【技术实现步骤摘要】
基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质
本专利技术涉及数据处理领域,尤其涉及一种基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质。
技术介绍
自然语言处理(NatureLanguageProcess)分为三个环节,其中大部分困难点都是出现在自然语言理解(NatureLanguageUnderstand)部分,主要问题是歧义问题和未知语言现象问题。一方面,自然语言中大量存在的歧义现象,无论在词法层次、句法层次,还是在语义层次和语用层次,无论哪类语言单位,其歧义性始终都是困扰人们实现应用目标的一个根本问题。另一方面,对于一个特定系统来说,总是有可能遇到未知词汇、未知结构等各种意想不到的情况,而且每一种语言又都随着社会的发展而动态变化着,新的词汇(尤其是一些新的人名、地名、组织机构名和专用词汇)、新的词义、新的词汇用法(新词类),甚至新的句子结构都在不断出现,尤其在口语对话或计算机网络对话(微博、博客等,稀奇古怪的词语和话语结构更是司空见惯。目前,市面上很多自然语言理解方法的实体识别率都特别低,所以我们将开发一种计算机场景下基于RasaNlu框架提高实体识别率的方法。
技术实现思路
针对上述存在的问题,本专利技术的目的是提供一种计算机场景下基于RasaNlu框架提高实体识别率的方法,解决现行方法实体识别率低下的问题,为了解决上述现有技术中存在的问题,本专利技术提供一种基于Rasa_Nlu框架提高实体识别率的方法,包括以下步骤:步骤S1:语音输入并使用jieba分词;步骤S2:语料获取及预处理;步骤S3:MITIE模型训练,采用MITIE中wordrep这一个工具进行模型训练,得到数据集;步骤S4:构建Rasa_Nlu语料和模型,用于进行意图识别和实体识别;步骤S5:获取用户的意图。优选的,步骤S4中所述意图识别是在句子级别进行分类,明确意图;所述实体识别是在词级别找出用户问题中的关键实体,进行实体槽填充。为达上述目的,本专利技术还提供一种基于Rasa_Nlu框架提高实体识别率的装置,包括信息输入模块,用于语音的输入;信息采集及预处理模块,用于采集语音信息,并且进行预处理;MITIE模型训练模块,用于模型训练,得到数据集;构建Rasa_Nlu语料和模型,用于进行意图识别和实体识别;获取模块,用于获取用户的意图。为达上述目的,本专利技术还提供一种基于Rasa_Nlu框架提高实体识别率的系统,包括存储器,处理器以及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。为达上述目的,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述方法的步骤。本专利技术的有益效果:运用当下最新的人工智能领域的自然语言处理技术,能精确的解析用户的意图,并且计算机场景下基于RasaNlu框架的方法可以提高实体识别率,为人们提供了很大的便利。附图说明图1为本专利技术具体实施例1基于Rasa_Nlu框架提高实体识别率方法的整体流程图。图2为本专利技术具体实施例2基于Rasa_Nlu框架提高实体识别率装置的结构框图。具体实施方式下面将结合本专利技术的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1图1为本专利技术基于Rasa_Nlu框架提高实体识别率方法提供具体实施例1整体流程图。如图1所示,一种基于Rasa_Nlu框架提高实体识别率的方法,包括以下步骤:步骤S1:语音输入并使用jieba分词。步骤S2:语料获取及预处理。步骤S3:MITIE模型训练,采用MITIE中wordrep这一个工具进行模型训练,得到数据集。步骤S4:构建Rasa_Nlu语料和模型,用于进行意图识别和实体识别。在本步骤中,所述意图识别是在句子级别进行分类,明确意图;所述实体识别是在词级别找出用户问题中的关键实体,进行实体槽填充。步骤S5:获取用户的意图。实施例2图2为本专利技术基于Rasa_Nlu框架提高实体识别率装置提供具体实施例2的结构框图。如图2所示,本实施例提供一种基于Rasa_Nlu框架提高实体识别率的装置,包括信息输入模块,用于语音的输入;信息采集及预处理模块,用于采集语音信息,并且进行预处理;MITIE模型训练模块,用于模型训练,得到数据集;构建Rasa_Nlu语料和模型,用于进行意图识别和实体识别;获取模块,用于获取用户的意图。实施例3本实施例提供一种基于Rasa_Nlu框架提高实体识别率的系统,包括存储器,处理器以及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。实施例4本实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述方法的步骤。综上,本专利技术上述各实施例公开的基于Rasa_Nlu框架提高实体识别率方法、装置、系统及存储介质,运用当下最新的人工智能领域的自然语言处理技术,能精确的解析用户的意图,并且计算机场景下基于RasaNlu框架的方法可以提高实体识别率,为人们提供了很大的便利。以上所述,仅为本专利技术的具体实施方式,但本专利技术的保护范围并不局限于此,任何熟悉该技术的人在本专利技术所揭露的技术范围内,可理解想到的变换或更替,都应涵盖在本专利技术的包含范围之内,因此,本专利技术的保护范围应该以权利要求书的保护范围为准。本文档来自技高网...

【技术保护点】
1.一种基于Rasa_Nlu框架提高实体识别率的方法,其特征在于包括以下步骤:/n步骤S1:语音输入并使用jieba分词;/n步骤S2:语料获取及预处理;/n步骤S3:MITIE模型训练,采用MITIE中wordrep这一个工具进行模型训练,得到数据集;/n步骤S4:构建Rasa_Nlu语料和模型,用于进行意图识别和实体识别;/n步骤S5:获取用户的意图。/n

【技术特征摘要】
1.一种基于Rasa_Nlu框架提高实体识别率的方法,其特征在于包括以下步骤:
步骤S1:语音输入并使用jieba分词;
步骤S2:语料获取及预处理;
步骤S3:MITIE模型训练,采用MITIE中wordrep这一个工具进行模型训练,得到数据集;
步骤S4:构建Rasa_Nlu语料和模型,用于进行意图识别和实体识别;
步骤S5:获取用户的意图。


2.如权利要求1所述的基于Rasa_Nlu框架提高实体识别率的方法,其特征在于:步骤S4中所述意图识别是在句子级别进行分类,明确意图;所述实体识别是在词级别找出用户问题中的关键实体,进行实体槽填充。


3.一种基于Rasa_Nlu框架提高实体识别率的...

【专利技术属性】
技术研发人员:冯海洪毛德平王康
申请(专利权)人:安徽咪鼠科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1