一种实体抽取方法、装置、设备及存储介质制造方法及图纸

技术编号：37369961 阅读：21 留言：0更新日期：2023-04-27 07:15

本发明专利技术公开了实体抽取方法、装置、设备及存储介质，属于人工智能技术领域。该方法包括：获取餐饮场景下用户与机器人交互过程中的目标问句；基于语言模型引擎，对所述目标问句进行向量化处理，得到目标问句向量；根据所述目标问句向量、以及目标知识图谱对应的向量索引，确定目标实体。通过上述技术方案，提高餐饮场景下实体抽取的准确性，从而精准识别用户意图。图。图。

全部详细技术资料下载

【技术实现步骤摘要】
一种实体抽取方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种实体抽取方法、装置、设备及存储介质。

技术介绍

[0002]在现有语音交互场景招牌菜的知识图谱问答中，现有知识图谱意图与实体匹配的算法逻辑是，先将问句与图谱里的实体进行硬匹配，得到匹配的实体以后根据实体的所属类型进行实体替换，将问句模板化后进行模板匹配，最后可得意图。
[0003]目前这种先进行实体的硬匹配后进行问句模板匹配的方式，在图谱构造越来越庞大、实体越来越丰富的情况下，对实体的硬匹配会极大的消耗运算时间，实体与实体之间也会有分词上的冲突(例如，辣子鸡丁、辣子鸡、辣子，这实际上是三种不同的食物，那实际分词的时候是以最细粒度“辣子”来分，还是以最粗粒度“辣子鸡丁”来分，在不同的场景下，一旦分错则可能造成意图失配)。另外，基于分词的问句模板在意图识别上十分受限，只具备微小的泛化能力，此时，换一种问法可能识别不到意图，用户体验很差。因此，亟需一种更有效且准确的实体抽取方法来更精准地匹配用户意图。

技术实现思路

[0004]本专利技术提供了一种实体抽取方法、装置、设备及存储介质，以提高餐饮场景下实体抽取的准确性，从而精准识别用户意图。
[0005]根据本专利技术的一方面，提供了一种实体抽取方法，该方法包括：
[0006]获取餐饮场景下用户与机器人交互过程中的目标问句；
[0007]基于语言模型引擎，对所述目标问句进行向量化处理，得到目标问句向量；
[0008]根据所述目...

【技术保护点】

【技术特征摘要】
1.一种实体抽取方法，其特征在于，包括：获取餐饮场景下用户与机器人交互过程中的目标问句；基于语言模型引擎，对所述目标问句进行向量化处理，得到目标问句向量；根据所述目标问句向量、以及目标知识图谱对应的向量索引，确定目标实体。2.根据权利要求1所述的方法，其特征在于，所述向量索引通过如下方式确定：确定至少一个物体实体、所述物体实体对应的至少一个物体属性、所述物体属性对应的属性值、以及所述物体属性对应的至少一个问句模板；对于每一问句模板，对该问句模板与该问句模板对应的所述物体实体、所述物体实体对应的物体属性以及所述物体属性对应的属性值进行预设处理，得到该问句模板对应的至少一个新问句；基于所述语言模型引擎，对所述新问句进行向量化处理，得到问句向量；基于至少一个问句向量、所述问句向量对应的问句模板和物体实体，构建向量索引。3.根据权利要求1所述的方法，其特征在于，所述向量索引还包括物体属性和/或不同物体实体之间的关系。4.根据权利要求1所述的方法，其特征在于，所述根据所述目标问句向量、以及目标知识图谱对应的向量索引，确定目标实体，包括：根据所述目标问句向量、以及目标知识图谱对应的向量索引，确定候选实体；根据所述候选实体，确定所述目标问句的目标实体。5.根据权利要求4所述的方法，其特征在于，所述根据所述目标问句向量、以及目标知识图谱对应的向量索引，确定候选实体，包括：确定所述目标问句向量和向量索引中问句向量之间的相似度，并根据所述相似度，从所述向量索引中确定候选问句向量；根据所述候选问句向量，确定候选问句；对所述候选问句进行实体抽取，得到所述候选实体。6.根据权利要求4所述的...

【专利技术属性】
技术研发人员：张辉，李翔远，栾小飞，苏晴，
申请(专利权)人：上海擎朗智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人