一种基于制造技术

技术编号：39502899 阅读：9 留言：0更新日期：2023-11-24 11:34

本发明专利技术涉及一种基于

全部详细技术资料下载

【技术实现步骤摘要】
一种基于rasa框架的实体校正方法及存储介质

[0001]本申请涉及自然语言处理
，具体涉及一种基于
rasa
框架的实体校正方法及存储介质
。

技术介绍

[0002]随着人工智能的发展，智能问答机器人已经成为诸多领域的研究热点，利用自然语言处理技术理解用户问题，协助用户进行信息查询
、
数据分析
。
目前的问答系统可以分为面向任务
、
面向知识和面向聊天三类，其中面向任务和面向知识的问答系统都会涉及到实体提取，根据提取出的实体进行信息检索和数据分析，但在实际的使用场景中，因为各种原因用户可能会输入错误，包括错别字
、
个别字缺失
、
简称等，导致在知识库中无法准确检索相关信息，从而无法正确回答用户的问题
。
比如台风“莫兰蒂”，用户可能输成“莫兰迪”、“莫迪兰”、“莫兰帝”等等
。
[0003]Rasa
是一个开源的自然语言处理框架，用于构建聊天机器人和语音助手
。
它提供了一系列工具和库，可以帮助开发者构建自然语言处理模型，包括意图识别
、
实体提取
、
对话管理等功能
。Rasa
自带
EntitySynonymMapper
模块，可以通过设置同义词匹配，在一定程度上解决上述问题，但实际情况五花八门，难以穷举出所有情况
。
[0004]现有的实体校正技术主要包括以下几类...

【技术保护点】

【技术特征摘要】
1.
一种基于
rasa
框架的实体校正方法，其特征在于，包括以下步骤：基于
rasa
框架，对用户的输入进行实体抽取，得到目标实体；根据目标实体从知识库中搜索出所有相同类型的实体作为候选实体；计算目标实体与候选实体之间的相似度；将相似度超过预设值的候选实体中相似度最大的候选实体作为校正值
。2.
根据权利要求1所述的基于
rasa
框架的实体校正方法，其特征在于，所述“计算目标实体与候选实体之间的相似度”具体包括以下步骤：分别构建目标实体的特征向量和候选实体的特征向量；通过余弦相似度衡量目标实体和候选实体的第一相似度
。3.
根据权利要求2所述的基于
rasa
框架的实体校正方法，其特征在于，所述“分别构建目标实体的特征向量和候选实体的特征向量”具体包括以下步骤：通过
TF
‑
IDF
算法分别构建目标实体的特征向量和候选实体的特征向量
。4.
根据权利要求2所述的基于
rasa
框架的实体校正方法，其特征在于，所述“计算目标实体与候选实体之间的相似度”还包括以下步骤：计算目标实体和候选实体之间的编辑距离，得到目标实体和候选实体的第二相似度；对目标实体和候选实体的第一相似度和第二相似度进行加权求和，得到目标实体和候选实体最终的相似度
。5.
根据权利要求4所述的基于
rasa
框架的实体校正方法，其特征在于，所述“计算目标实体与候选实体之间的相似度”还包括以下步骤：将目标实体及候选实体由中文字符串转换成拼音字符串，计算目标实体的拼音字符串与候选实体...

【专利技术属性】
技术研发人员：戴诗琪，林永清，吴闽帆，吴弘毅，刘添强，
申请(专利权)人：四创科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人