【技术实现步骤摘要】
本专利技术属于自然语言处理,具体涉及一种命名实体自动识别方法、系统与计算机可读存储介质。
技术介绍
1、目前,自然语言处理中命名实体识别技术在中文文本中实体的边界和类别的识别方面具有可观的效果。同时,为了使识别结果易于被直观地理解,现有的框架往往引入知识图谱作为命名实体背景知识的补充,并且在知识问答系统中应用命名实体识别与知识图谱技术。然而,装备知识问答系统只能实现特定问句的解析与答案的生成,并不能自动且快速地对大规模的文本信息进行实体识别与背景知识展示。因此,亟需设计一种新的命名实体识别系统,以弥补现有技术的缺陷。
2、通过上述分析,现有技术存在的问题及缺陷为:
3、现有的知识问答系统只能实现特定问句的解析与答案的生成,不能自动且快速地对大规模的文本信息进行实体识别与背景知识展示。
技术实现思路
1、本专利技术的目的在于,提供一种命名实体自动识别方法、系统与计算机可读存储介质,将有效地解决命名实体识别接口不便于调用的缺点,降低用户的使用复杂度,增加用户对领域实体进
...【技术保护点】
1.一种命名实体自动识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种命名实体自动识别方法,其特征在于,预设特定领域至少包括舰船、飞行器、战车和枪械;预设特定领域的实体知识至少包括舰船、飞行器、战车、枪械的名称、分类、简介以及产国属性。
3.根据权利要求1所述的一种命名实体自动识别方法,其特征在于,S102具体为:将文档格式文件的文本信息与段落索引信息封装为JSON文件,并通过HTTPS协议输入命名实体识别模型中,并通过自然语言处理技术对文本信息进行预处理和句子切分;其中,预处理至少包括将文本信息中全角字符转换为半角字符、繁体字
...【技术特征摘要】
1.一种命名实体自动识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种命名实体自动识别方法,其特征在于,预设特定领域至少包括舰船、飞行器、战车和枪械;预设特定领域的实体知识至少包括舰船、飞行器、战车、枪械的名称、分类、简介以及产国属性。
3.根据权利要求1所述的一种命名实体自动识别方法,其特征在于,s102具体为:将文档格式文件的文本信息与段落索引信息封装为json文件,并通过https协议输入命名实体识别模型中,并通过自然语言处理技术对文本信息进行预处理和句子切分;其中,预处理至少包括将文本信息中全角字符转换为半角字符、繁体字符转换为简体字符、英文字母的大写转小写;句子切分具体为:根据句号、逗号、叹号、问号将文本信息切分为若干个独立的句子。
4.根据权利要求1所述的一种命名实体自动识别方法,其特征在于,命名实体识别模型包括字嵌入层、bert网络、两个全连接层以及对应的归一化指数层,其中,字嵌入层用于将输入的文本信息转换为嵌入向量,bert网络用于对文本信息进行深层语义编码,两个全连接层用于学习特征表示,对应的归一化指数层用于对命名实体的识别结果进行归一化处理;通过命名实体识别模型对命名实体的起始位置索引以及结束位置索引进行输出...
【专利技术属性】
技术研发人员:董晓明,张舒,陶鹏,张龙剑,余建,
申请(专利权)人:中国舰船研究设计中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。