【技术实现步骤摘要】
实体简称转化方法、可读存储介质和电子设备
本专利技术涉及计算机
,尤其涉及一种实体简称转化方法、可读存储介质和电子设备。
技术介绍
目前在搜索、自然语言处理(NaturalLanguageProcessing)等领域中,根据命名实体的全称查询对应的简称是一项重要的功能。然而现有的实体全程转化为简称的方案大多都是采用人工标注或者web网页抓取的方式获取到实体的简称数据,这两种方法都需要大量的人工工作量和数据的积累。
技术实现思路
有鉴于此,本专利技术实施例提供一种实体简称转化方法、可读存储介质和电子设备,旨在摒弃通过人工计算获取实体简称的方式,实现自动计算实体简称。第一方面,本专利技术实施例公开了一种实体简称转化方法,所述方法包括:根据实体全称确定第一词向量序列;将所述第一词向量序列中的第一词向量依次输入编码网络以确定编码向量;将所述编码向量输入解码网络以确定第二词向量序列;根据所述第二词向量序列确定实体简称。进一步地,所述根据实体全称确定第一词向量序列包括:对所述实体全称进行分词处理以确定词序列;将所述词序列中的各元素转换为对应的词向量以确定第一词向量序列。进一 ...
【技术保护点】
1.一种实体简称转化方法,其特征在于,所述方法包括:根据实体全称确定第一词向量序列;将所述第一词向量序列中的第一词向量依次输入编码网络以确定编码向量;将所述编码向量输入解码网络以确定第二词向量序列;根据所述第二词向量序列确定实体简称。
【技术特征摘要】
1.一种实体简称转化方法,其特征在于,所述方法包括:根据实体全称确定第一词向量序列;将所述第一词向量序列中的第一词向量依次输入编码网络以确定编码向量;将所述编码向量输入解码网络以确定第二词向量序列;根据所述第二词向量序列确定实体简称。2.根据权利要求1所述的方法,其特征在于,所述根据实体全称确定第一词向量序列包括:对所述实体全称进行分词处理以确定词序列;将所述词序列中的各元素转换为对应的词向量以确定第一词向量序列。3.根据权利要求1所述的方法,其特征在于,所述将所述编码向量输入解码网络以确定第二词向量序列包括:将所述编码向量输入所述解码网络确定并记录一个解码向量,每个所述解码向量用于表征一个字符;以迭代的方式将所述解码向量输入所述解码网络以确定并记录一个解码向量,直到满足预设条件时结束所述迭代过程;根据每一次输出记录的解码向量确定第二词向量序列。4.根据权利要求3所述的方法,其特征在于,所述迭代过程包括:将上一次迭代后确定的解码向量输入所述解码网络以确定解码向量集合,所述解码向量集合中包括解码向量和与所述解码向量对应的概率值;确定所述解码向量集合中对应概率值最大的解码向量为本次迭代过程的输出。5.根据权利要求3所述的方法,其特征在于,所述预设条件包括:所述记录的解码向量数量达到预设值;或者一次迭代过程中确定的解码向量用于表征结束符。6.根据权利要求1所述的方法,其特征在于,所述将所述编码向量输入解码...
【专利技术属性】
技术研发人员:陈晓宇,
申请(专利权)人:出门问问苏州信息科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。