对话中的实体识别方法、装置、设备及存储介质制造方法及图纸

技术编号：43470020 阅读：15 留言：0更新日期：2024-11-27 13:08

本公开涉及一种对话中的实体识别方法、装置、设备及存储介质，其中，方法包括：获取对话文本；对对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量；将每个单句与领域知识库中的实体信息进行匹配，以从领域知识库中确定包含于单句中的目标实体；根据目标实体对应的权重对第一特征向量中的目标实体进行加权，生成每个单句对应的第二特征向量；将第二特征向量输入实体识别模型，生成实体识别结果。根据本公开的技术方案，能够提高实体识别模型的识别能力及准确度，提升用户的交互体验。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及车辆，尤其涉及一种对话中的实体识别方法、装置、设备及存储介质。

技术介绍

1、命名实体识别(named entity recognition,简称ner)是指给定一段文本，识别出文本中具有特定意义的实体词，包括人名、地名、机构名、专有名词等，在影视实体识别场景中，待识别的实体为影视片名或人物名。

2、目前的命名实体识别方法包括采用深度学习的方法，将任务表示为多分类任务或者序列标注任务，从数据中学习以进行命名实体识别。

3、随着大数据技术的发展和资源类数据的指数增长，视频媒资领域涌现了大量的影视相关实体，如影视作品名、演员名、导演名等非结构化数据，很多影视片名中经常出现网络用语、口语化用语等新词汇，例如“我有一点小糊涂”既是主题曲名，又是日常闲聊中的常见用语，在新上映的影视剧存在前述新词汇时，在识别此类实体词时难以与闲聊场景进行区分，因此，针对以上情况如何准确的从对话中提取命名实体是一个亟待解决的技术问题。

技术实现思路

1、为了解决上述技术问题，本公开提供...

【技术保护点】

1.一种对话中的实体识别方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述对所述对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量，包括：

3.如权利要求1所述的方法，其特征在于，根据所述目标实体在所述领域知识库中对应的预设权重对所述第一特征向量中的目标实体进行加权，生成每个单句对应的第二特征向量，包括：

4.如权利要求1所述的方法，其特征在于，所述领域知识库为闲聊知识库和影视实体库，所述将每个单句与领域知识库中的实体信息进行匹配，以从所述领域知识库中确定包含于所述单句中的目标实体，包括：

5.如权利要求4所述...

【技术特征摘要】

1.一种对话中的实体识别方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述对所述对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量，包括：

4.如权利要求1所述的方法，其特征在于，所述领域知识库为闲聊知识库和影视实体库，所述将每个单句与领域知识库中的实体信息进行匹配，以从所述领域知识库中确定包含于所...

【专利技术属性】
技术研发人员：徐洋，陈伟，江会星，
申请(专利权)人：北京罗克维尔斯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人