基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质制造方法及图纸

技术编号：23149265 阅读：27 留言：0更新日期：2020-01-18 13:32

本发明专利技术涉及数据处理领域，尤其涉及一种基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质，该方法包括：首先，输入语音并使用jieba分词；然后获取语料并进行预处理；接下来，进行MITIE模型训练，采用MITIE中wordrep这一个工具进行模型训练，得到数据集；最后，构建Rasa_Nlu语料和模型，用于进行意图识别和实体识别，获取用户的意图，本发明专利技术运用当下最新的人工智能领域的自然语言处理技术，能精确的解析用户的意图，并且本发明专利技术计算机场景下基于Rasa_Nlu框架的方法可以提高实体识别率，解决现行方法实体识别率低下的问题，为人们提供了很大的便利。

Methods, devices, systems and storage media for improving entity recognition rate based on rasa \ufe63 NLU framework

全部详细技术资料下载

【技术实现步骤摘要】
基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质
本专利技术涉及数据处理领域，尤其涉及一种基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质。
技术介绍
自然语言处理(NatureLanguageProcess)分为三个环节，其中大部分困难点都是出现在自然语言理解(NatureLanguageUnderstand)部分,主要问题是歧义问题和未知语言现象问题。一方面，自然语言中大量存在的歧义现象，无论在词法层次、句法层次，还是在语义层次和语用层次，无论哪类语言单位，其歧义性始终都是困扰人们实现应用目标的一个根本问题。另一方面，对于一个特定系统来说，总是有可能遇到未知词汇、未知结构等各种意想不到的情况，而且每一种语言又都随着社会的发展而动态变化着，新的词汇(尤其是一些新的人名、地名、组织机构名和专用词汇)、新的词义、新的词汇用法(新词类)，甚至新的句子结构都在不断出现，尤其在口语对话或计算机网络对话(微博、博客等，稀奇古怪的词语和话语结构更是司空见惯。目前，市面上很多自然语言理解方法的实体识别率都特别低，所以我们将开发一种计算机场景下基于RasaNlu框架提高实体识别率的方法。
技术实现思路
针对上述存在的问题，本专利技术的目的是提供一种计算机场景下基于RasaNlu框架提高实体识别率的方法，解决现行方法实体识别率低下的问题，为了解决上述现有技术中存在的问题，本专利技术提供一种基于Rasa_Nlu框架提高实体识别率的方法，包括以下步骤：步骤S1...

【技术保护点】
1.一种基于Rasa_Nlu框架提高实体识别率的方法，其特征在于包括以下步骤：/n步骤S1：语音输入并使用jieba分词；/n步骤S2：语料获取及预处理；/n步骤S3：MITIE模型训练，采用MITIE中wordrep这一个工具进行模型训练，得到数据集；/n步骤S4：构建Rasa_Nlu语料和模型，用于进行意图识别和实体识别；/n步骤S5：获取用户的意图。/n

【技术特征摘要】
1.一种基于Rasa_Nlu框架提高实体识别率的方法，其特征在于包括以下步骤：
步骤S1：语音输入并使用jieba分词；
步骤S2：语料获取及预处理；
步骤S3：MITIE模型训练，采用MITIE中wordrep这一个工具进行模型训练，得到数据集；
步骤S4：构建Rasa_Nlu语料和模型，用于进行意图识别和实体识别；
步骤S5：获取用户的意图。

2.如权利要求1所述的基于Rasa_Nlu框架提高实体识别率的方法，其特征在于：步骤S4中所述意图识别是在句子级别进行分类，明确意图；所述实体识别是在词级别找出用户问题中的关键实体，进行实体槽填充。

3.一种基于Rasa_Nlu框架提高实体识别率的...

【专利技术属性】
技术研发人员：冯海洪，毛德平，王康，
申请(专利权)人：安徽咪鼠科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人