【技术实现步骤摘要】
文字中获取表达式的方法和装置
本专利技术涉及人工智能领域,尤其涉及一种文字中获取表达式的方法和装置。
技术介绍
在日常工作、学习和生活中,会涉及到很多报表、声明、文件等文本,在这些文本中,重要的信息往往可以是文本中的一些实体。比如在“2013年度公司管理费用花费了2306万元”的文本中,实体“2013年度”、实体“公司管理费用”和实体“2306万元”就可以将文本的重要信息囊括。在一些文本中,文本中的多元组内的一些实体是基于其他实体以及文字中叙述的关系得出的。在文本撰写完成后,为了避免文本中出现错误,需要工作人员人工进行检查。实体之间的关系也需要工作人员一一核对或计算。比如,文本中“2013年度、2014年度、2015年度和2016年1-3月,货币资金占当期总资产的比重分别为18.40%、19.75%、15.49%和11.96%”的句子中,工作人员需要阅读后人工总结表达式,从而计算出货币资金占当期总资产的比重,从而与文本中的“18.40%”“19.75%”“15.49%”和“11.96%”进行核对。由于报表、声明、文件等文本往往内容较多,工作人员需要花费大量时间才能 ...
【技术保护点】
1.一种文字中获取表达式的方法,其特征在于,包括:按照在所述待测文本中的排列顺序,在所述待测文本中提取得到N个待测词语,将所述N个待测词语的词向量作为一层运算的N个节点,所述待测文本包括文字,N为大于1的整数;将所述一层运算中的第i个节点、所述一层运算中的第1个节点至第i‑1个节点以及预设的运算符集输入至循环神经网络的子网络中,得到二层运算的节点,所述二层运算的节点为一层运算中所述子网络输出的隐向量,所述运算符集包括运算符的词向量,i为整数,且1≤i≤N;根据所述二层运算的节点,确定所述一层运算中的有效运算符;直至将M层运算的节点中的第j个节点、所述M层运算的节点中的第1个 ...
【技术特征摘要】
1.一种文字中获取表达式的方法,其特征在于,包括:按照在所述待测文本中的排列顺序,在所述待测文本中提取得到N个待测词语,将所述N个待测词语的词向量作为一层运算的N个节点,所述待测文本包括文字,N为大于1的整数;将所述一层运算中的第i个节点、所述一层运算中的第1个节点至第i-1个节点以及预设的运算符集输入至循环神经网络的子网络中,得到二层运算的节点,所述二层运算的节点为一层运算中所述子网络输出的隐向量,所述运算符集包括运算符的词向量,i为整数,且1≤i≤N;根据所述二层运算的节点,确定所述一层运算中的有效运算符;直至将M层运算的节点中的第j个节点、所述M层运算的节点中的第1个节点至第j-1个节点、所述一层运算的节点至所述M-1层运算的节点以及所述运算符集输入至所述循环神经网络的子网络中,得到M+1层运算的节点,且根据所述M+1层运算的节点,得到所述M层运算中的有效运算符的个数为0为止,所述M+1层运算的节点为所述M层运算中上述子网络输出的隐向量,M和j均为大于1的整数;根据所述一层运算中的有效运算符至所述M-1层运算中的有效运算符,以及与所述有效节点对应的词语,生成所述待测文本中表达式,所述有效节点为与所述有效运算符对应的节点。2.根据权利要求1所述的方法,其特征在于,所述在所述待测文本中提取得到N个待测词语,包括:在所述待测本文中提取N个多元实体,将所述N个多元实体作为所述N个待测词语。3.根据权利要求1所述的方法,其特征在于,所述将所述一层运算中的第i个节点、所述一层运算中的第1个节点至第i-1个节点以及预设的运算符集输入至循环神经网络的子网络中,得到二层运算的节点,包括:将所述一层运算中的第i个节点分别与所述一层运算中的第1个节点至第i-1个节点组合,对应输入循环神经网络的i-1个子网络中;对于每一个子网络,将预设的运算符集中的运算符的词向量依次输入子网络,得到子网络输出的所述二层运算的节点。4.根据权利要求1所述的方法,其特征在于,所述根据所述二层运算的节点,确定所述一层运算中的有效运算符,包括:对所述二层运算的节点进行分类,得到分类结果,所述分类结果包括与所述运算符集中的运算符的词向量匹配或与所述运算符集中的运算符的词向量不匹配;将与所述运算符集中的运算符的词向量匹配的所述二层运算的节点对应的运算符作为所述一层运算中的有效运算符。5.根据权利要求1所述的方法,其特征在于,还包括:在所述表格或所述文字中提取与所述表达式中相关词语对应的待测元素,所述相关词语为与所述表达式中的所述有效节点对应的词语,所述待测文本还包括表格;将所述待测元素代入所述表达式,判断代入所述待测元素的表达式是否成立;若代入所述待测元素的表达式不成立,则生成用于提示所述表格或所述文字出现错误的提示消息。6.一种文字中获取表达式...
【专利技术属性】
技术研发人员:林得苗,
申请(专利权)人:北京庖丁科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。