图谱式自然语言优化方法及电子装置制造方法及图纸

技术编号:37503852 阅读:25 留言:0更新日期:2023-05-07 09:39
本公开提供一种图谱式自然语言优化方法及电子装置。此方法适用于具有处理器的电子装置。此方法接收用户输入的输入语句,并从所述输入语句中撷取多个领域相关实体。将所述多个领域相关实体输入图谱数据库以分析所述多个领域相关实体之间的连结关系,并基于所述连结关系从所述图谱数据库获取填补数据。通过自然语言处理技术对所述输入语句与所述填补数据进行解析,以生成优化自然语言语句。以生成优化自然语言语句。以生成优化自然语言语句。

【技术实现步骤摘要】
图谱式自然语言优化方法及电子装置


[0001]本公开涉及一种自然语言处理技术,且是有关于一种图谱式自然语言优化方法及电子装置。

技术介绍

[0002]自然语言处理(Natural Language Processing,NLP)是人工智能和语言学领域中针对人类语言进行各种自动化处理的技术,其目的是要让计算机分析、理解、合成人类语言。自然语言处理涵盖的议题相当广泛,包括断词、句法剖析、语意推论、机器翻译、语音识别、语音合成、语言生成等技术。
[0003]一般来说,为了教育用户操作系统、机台、产品或执行实验步骤,厂商通常会撰写操作手册。此操作手册例如是指教学手册、使用手册、训练手册等。然而,传统操作手册中的操作指令通常包含许多信息缺口,例如机台的操作手册中经常缺乏零件名称、操作手法、操作位置、规范条件等信息。信息缺口将大幅增加用户理解操作指令的认知负荷(cognitive load),从而导致用户参照操作手册中的操作指令进行操作时,极可能因认知错误而造成操作错误。因此,如何填补语句中信息缺口为目前自然语言优化技术的研究议题之一。

技术实现思路

[0004]本公开提供一种图谱式自然语言优化方法及电子装置,可使得生成的操作指令是不具有信息缺口的自然语言语句。
[0005]本公开提供一种图谱式自然语言优化方法,适用于具有处理器的电子装置。所述方法包括:通过数据撷取装置接收用户输入的输入语句;从所述输入语句中撷取多个领域相关实体;将所述多个领域相关实体输入图谱数据库以分析所述多个领域相关实体之间的连结关系,并基于所述连结关系从所述图谱数据库获取填补数据;以及通过自然语言处理技术对所述输入语句与所述填补数据进行解析,以生成优化自然语言语句。
[0006]本公开还提供一种电子装置,包括数据撷取装置、存储装置以及处理器。所述数据撷取装置经配置以接收用户输入的输入语句。所述存储装置,存储一或多个指令及图谱数据库。所述处理器耦接至所述数据撷取装置以及所述存储装置。并且,所述处理器经配置以执行所述指令:从所述输入语句中撷取多个领域相关实体;将所述多个领域相关实体输入所述图谱数据库以分析所述多个领域相关实体之间的连结关系,并基于所述连结关系从所述图谱数据库获取填补数据;以及通过自然语言处理技术对所述输入语句与所述填补数据进行解析,以生成优化自然语言语句。
[0007]基于上述,本公开实施例提供的图谱式自然语言优化方法及电子装置,可填补输入语句中的信息缺口,并将包含信息缺口的输入语句优化为信息完整的自然语言语句。基此,本公开可使得生成的操作指令是不具有信息缺口的自然语言语句,从而提升输入语句的信息完整度与理解度。
[0008]为让本公开的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详
细说明如下。
附图说明
[0009]图1示出依据本公开一实施例的电子装置的方块图;
[0010]图2示出依据本公开一实施例的知识图谱的示意图;
[0011]图3示出依据本公开一实施例的图谱式自然语言优化方法的流程图;
[0012]图4示出依据本公开一实施例的知识图谱的示意图。
具体实施方式
[0013]现将详细地参考本公开的示范性实施例,示范性实施例的实例说明于附图中。只要有可能,相同元件符号在附图和描述中用来表示相同或相似部分。
[0014]图1示出依据本公开一实施例的电子装置的方块图。参照图1,电子装置100包括处理器110、存储装置120以及数据撷取装置130。处理器110耦接至存储装置120以及数据撷取装置130,而可存取并执行记录在存储装置120中的指令,以实现本公开实施例的图谱式自然语言优化方法。电子装置100可以是任何需要产生低认知负荷的自然语句的互动装置,例如是VR、AR或MR的头戴式装置,或是穿戴装置、个人计算机、服务器、行动装置等,本公开不在此限制。
[0015]在不同实施例中,处理器110例如是中央处理单元(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微处理器(Microprocessor)、数字信号处理器(Digital Signal Processor,DSP)、可编程控制器、专用集成电路(Application Specific Integrated Circuits,ASIC)、可编程逻辑装置(Programmable Logic Device,PLD)或其他类似装置或这些装置的组合,本公开不在此限制。
[0016]存储装置120例如是任意型式的固定式或可移动式随机存储器(Random Access Memory,RAM)、只读存储器(Read

Only Memory,ROM)、快闪记忆体(Flash memory)、硬盘或其他类似装置或这些装置的组合,而用以存储可由处理器110执行的一或多个指令,这些指令可载入处理器110。在本实施例中,存储装置120存储有图谱数据库121。图谱数据库121存储多个语义三元组(Semantic triple)格式的三元组数据,其中三元组格式的三元组数据例如是<第一实体(entity),关系信息(relationship),第二实体>。
[0017]图谱数据库121可存储根据三元组格式的三元组数据建立的知识图谱(Knowledge Graph,KG)。知识图谱可包含对应于一或多个实体的多个节点(node)以及对应实体之间的关系信息的连结线(edge)。知识图谱可表示多个节点中的各个节点之间是否相关联,并表示各节点之间的连结线对应的关系信息。在本实施例中,处理器110可接收由专家所提供的多个操作信息,根据操作信息产生三元组数据,并且根据三元组数据建立知识图谱。此操作信息例如是操作系统、机台、产品或执行实验的操作指令,例如:“用惰性气体吹J型衬垫(blow the j

liner with inert gases)”、“将手套拉过O形环(pull the glove over the O

ring)”等操作指令。
[0018]图2示出依据本公开一实施例的知识图谱的示意图。以工业维修领域为例,操作信息可包括第一实体(零件或材料名称、操作位置、规范条件等信息至少其中之一)、操作手法(关系信息)以及第二实体(零件或材料名称、操作位置、规范条件等信息至少其中之一)。例
如,操作信息“用惰性气体吹J型衬垫(blow the j

liner with inert gases)”包含零件或材料名称“J型衬垫”、操作手法“吹”以及零件或材料名称“惰性气体”。在取得操作信息后,处理器110可将操作信息转成三元组数据,例如<J型衬垫(零件或材料名称),吹(操作手法),惰性气体(零件或材料名称)>。接着,处理器110可根据零件或材料名称及操作位置在知识图谱上建立与零件或材料名称及操作位置相关的节点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图谱式自然语言优化方法,适用于具有处理器的电子装置,所述方法包括:通过数据撷取装置接收用户输入的输入语句;从所述输入语句中撷取多个领域相关实体;将所述多个领域相关实体输入图谱数据库以分析所述多个领域相关实体之间的连结关系,并基于所述连结关系从所述图谱数据库获取填补数据;以及通过自然语言处理技术对所述输入语句与所述填补数据进行解析,以生成优化自然语言语句。2.根据权利要求1所述的图谱式自然语言优化方法,其特征在于,从所述输入语句中撷取所述多个领域相关实体的步骤包括:对所述输入语句进行实体撷取操作,以从所述输入语句中撷取所述多个领域相关实体。3.根据权利要求1所述的图谱式自然语言优化方法,其特征在于,所述图谱数据库存储根据多个三元组数据建立的知识图谱,其中所述三元组数据包括第一实体、关系信息以及第二实体。4.根据权利要求3所述的图谱式自然语言优化方法,其特征在于,将所述多个领域相关实体输入所述图谱数据库以分析所述多个领域相关实体之间的所述连结关系的步骤包括:将所述多个领域相关实体输入所述知识图谱进行查询,以判断所述多个领域相关实体之间是否具有所述连结关系。5.根据权利要求3所述的图谱式自然语言优化方法,其特征在于,基于所述连结关系从所述图谱数据库获取所述填补数据的步骤包括:从所述知识图谱获取所述连结关系所指示与所述领域相关实体相关联的所述第一实体、所述关系信息以及所述第二实体至少其中之一作为所述填补数据。6.根据权利要求3所述的图谱式自然语言优化方法,其特征在于,所述知识图谱包括对应至多个所述第一实体及多个所述第二实体的多个节点,并包括对应至所述多个关系信息的多个连结线。7.根据权利要求6所述的图谱式自然语言优化方法,其特征在于,基于所述连结关系从所述图谱数据库获取所述填补数据的步骤包括:根据与所述多个领域相关实体相关联的所述连结线对应的权重计算所述多个领域相关实体之间的特征值;以及基于所述特征值决定与所述领域相关实体相关联的所述第一实体、所述关系信息以及所述第二实体至少其中之一作为所述填补数据。8.根据权利要求7所述的图谱式自然语言优化方法,其特征在于,根据与所述多个领域相关实体相关联的所述连结线对应的权重计算所述多个领域相关实体之间的所述特征值的步骤包括:基于所述知识图谱执行路径搜寻算法取得所述多个领域相关实体之间的多个路径,并根据所述路径中的所述连结线对应的权重计算所述路径的所述特征值。9.根据权利要求8所述的图谱式自然语言优化方法,其特征在于,基于所述特征值决定与所述领域相关实体相关联的所述第一实体、所述关系信息以及所述第二实体至少其中之一作为所述填补数据的步骤包括:
根据所述特征值选择多个所述路径其中之一作为候选路径,并获取所述候选路径所指示与所述领域相关实体相关联的所述第一实体、所述关系信息以及所述第二实体至少其中之一作为所述填补数据。10.根据权利要求1所述的图谱式自然语言优化方法,其特征在于,所述第一实体包括零件或材料名称、操作位置、规范条件至少其中之一,所述关系信息包括操作手法,并且所述第二实体包括零件或材料名称、操作位置、规范条件至少其中之一。11.一种...

【专利技术属性】
技术研发人员:王界人邱中人
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1