根据文本语义补充内容的方法和装置制造方法及图纸

技术编号:19691878 阅读:16 留言:0更新日期:2018-12-08 11:11
本发明专利技术提供了一种根据文本语义补充内容的方法和装置,涉及人工智能领域。该根据文本语义补充内容的方法包括:将已输入的文字转化为表达式;提取与已输入的文字对应的存储数据集合中的待测数据,并将待测数据代入表达式,运算得到表达式的表达结果;生成提示将表达结果添加在已输入的文字中的提示信息。能够提高文本制作过程的工作效率。

【技术实现步骤摘要】
根据文本语义补充内容的方法和装置
本专利技术涉及人工智能领域,尤其涉及一种根据文本语义补充内容的方法和装置。
技术介绍
在日常工作、学习和生活中,会涉及到很多报表、声明、文件等文本,在这些文本中,一些重要的信息往往由文字和表格共同表述。由于表格结构清楚,简单明了,操作人员一般会先制作表格,然后根据表格中的内容,来撰写文字表述部分。比如,A公司需要制作财务报表,其中包括A公司的前五大客户营业额以及占比情况,制作的表格如表一所示:表一操作人员需要根据表一来撰写文字表述部分,从而得到“2015年,公司在第一大客户的营业额为17593.89万元。2015年,公司前五大客户的营业额占总营业额的比例为55%”等文字表述部分。在撰写文字表述部分时,需要操作人员人工将其中的数据信息输入。但是由于文本中可能存在大量数据,且数据可能较为复杂。操作人员在输入时需要手工输入,且进行人工计算,使得文本的制作过程工作效率较低。
技术实现思路
本专利技术实施例提供了一种根据文本语义补充内容的方法和装置,能够提高文本制作过程的工作效率。一方面,本专利技术实施例提供了一种根据文本语义补充内容的方法,文本包括文字;方法包括:将已输入的文字转化为表达式;提取与已输入的文字对应的存储数据集合中的待测数据,并将待测数据代入表达式,运算得到表达式的表达结果;生成提示将表达结果添加在已输入的文字中的提示信息。另一方面,本专利技术实施例提供了一种根据文本语义补充内容的装置,文本包括文字;装置包括:转化模块,被配置为将已输入的文字转化为表达式;运算模块,被配置为提取与已输入的文字对应的存储数据集合中的待测数据,并将待测数据代入表达式,运算得到表达式的表达结果;提示生成模块,被配置为生成提示将表达结果添加在已输入的文字中的提示信息。本专利技术实施例提供了一种根据文本语义补充内容的方法和装置,将已输入的文字转化为表达式。提取与已输入的文字对应的存储数据集合中的待测数据,将待测数据代入表达式,运算得到表达式的表达结果。生成提示将表达结果添加在已输入的文字中的表达信息。与需要操作人员人工计算输入的文字中的表达结果的现有技术相比,在本专利技术实施例中,可以将已输入的文字转化为表达式,通过在与已输入的文字对应的存储数据集合中获取的待测数据,由装置运算得到已输入的文字的表达结果,不需要人工进行计算,从而提高了文本制作过程的工作效率。附图说明从下面结合附图对本专利技术的具体实施方式的描述中可以更好地理解本专利技术其中,相同或相似的附图标记表示相同或相似的特征。图1为本专利技术一实施例中根据文本语义补充内容的方法的流程图;图2为本专利技术实施例中一种提示信息的示意图;图3为本专利技术另一实施例中根据文本语义补充内容的方法的流程图;图4为本专利技术又一实施例中根据文本语义补充内容的方法的流程图;图5为本专利技术一实施例中根据文本语义补充内容的装置的结构示意图;图6为本专利技术另一实施例中根据文本语义补充内容的装置的结构示意图;图7为本专利技术又一实施例中根据文本语义补充内容的装置的结构示意图。具体实施方式下面将详细描述本专利技术的各个方面的特征和示例性实施例。在下面的详细描述中,提出了许多具体细节,以便提供对本专利技术的全面理解。但是,对于本领域技术人员来说很明显的是,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术的更好的理解。本专利技术决不限于下面所提出的任何具体配置和算法,而是在不脱离本专利技术的精神的前提下覆盖了元素、部件和算法的任何修改、替换和改进。在附图和下面的描述中,没有示出公知的结构和技术,以便避免对本专利技术造成不必要的模糊。图1为本专利技术一实施例中根据文本语义补充内容的方法的流程图。如图1所示,根据文本语义补充内容的方法包括步骤101至步骤103。在步骤101中,将已输入的文字转化为表达式。其中,输入的文字可包括表达式。若输入的文字包括表达式,则可直接获取该表达式用于后续步骤。输入的文字也可不包括表达式。若输入的文字不包括表达式,则可根据已输入的文字的语义,来将输入的文字转化为表达式。表达式可以为算术表达式,也可以为逻辑关系表达式,在此并不限定。需要说明的是,已输入的文字转化出的表达式的数目可能为1个,也可能为2个以上,在此并不限定。在一个示例中,可以对输入的文字进行分词,得到一个以上的词语。根据语义,得到词语之间的运算关系。从而根据词语以及运算关系,得到已输入的文字转化出的表达式。比如,已输入的文字为“2015年,公司在第一大客户的营业额为”,则将已输入的文字转化为的表达式为“第一大客户营业额=”。又比如,已输入的文字为“2015年,公司前五大客户的营业额占总营业额的比例为”,则将已输入的文字转化为的表达式为“2015年公司前五大客户营业额/总营业额=”;和/或,将已输入的文字转化为的表达式为“2015年公司前五大客户营业额占总营业额比例=2015年公司第一大客户营业额占总营业额比例+2015年公司第二大客户营业额占总营业额比例+2015年公司第三大客户营业额占总营业额比例+2015年公司第四大客户营业额占总营业额比例+2015年公司第五大客户营业额占总营业额比例=”。在步骤102中,提取与已输入的文字对应的存储数据集合中的待测数据,并将待测数据代入表达式,运算得到表达式的表达结果。其中,与已输入的文字对应的存储数据集合的形式并不限定,比如,存储数据集合可以为文字所在文本中的表格,也可以为其他文本中的表格,还可以为外部的数据库。待测数据为存储数据集合中的各种数据。比如,待测数据可以为存储数据集合中的各种项目、各种属性,以及各种项目对应的值和各种属性对应的值。已输入的文字中并不含有表达结果,表达结果由根据文本语义补充内容的装置运算得到。比如,已输入的文字为“2015年,公司前五大客户的营业额占总营业额的比例为”,“为”之后应为表达结果。在步骤102中运算得到表达式的表达结果后,可将表达结果以提示信息的方式显示在终端设备上。比如,已输入的文字为“2015年,公司前五大客户的营业额占总营业额的比例为”。存储数据结合为文本中的表格,且文本中的表格如表一所示。则“2015年”“营业额”“占比”“NO.1”“NO.2”“NO.3”“NO.4”“NO.5”,以及表格中的各个数值均为待测数据。其中,表格中的“2015年”与已输入的文字中的“2015年”对应;表格中的“营业额”以及和营业额对应的数值与已输入的文字中的“营业额”对应;表格中的“NO.1”“NO.2”“NO.3”“NO.4”“NO.5”与已输入的文字中的“前五大客户”对应;表格中的“占比”以及和占比对应的数值与已输入的文字中的“比例”对应。已输入的文字转化为的表达式为“2015年公司前五大客户营业额占总营业额比例=2015年公司NO.1客户营业额占总营业额比例+2015年公司NO.2客户营业额占总营业额比例+2015年公司NO.3客户营业额占总营业额比例+2015年公司NO.4客户营业额占总营业额比例+2015年公司NO.5客户营业额占总营业额比例=”,则可以将表格中2015年公司NO.1客户营业额占总营业额比例“22.32”、2015年公司NO.2客户营业额占总营业额比例“12.14”、2015年公司N本文档来自技高网...

【技术保护点】
1.一种根据文本语义补充内容的方法,其特征在于,所述文本包括文字;所述方法包括:将已输入的文字转化为表达式;提取与所述已输入的文字对应的存储数据集合中的待测数据,并将所述待测数据代入所述表达式,运算得到所述表达式的表达结果;生成提示将所述表达结果添加在已输入的文字中的提示信息。

【技术特征摘要】
1.一种根据文本语义补充内容的方法,其特征在于,所述文本包括文字;所述方法包括:将已输入的文字转化为表达式;提取与所述已输入的文字对应的存储数据集合中的待测数据,并将所述待测数据代入所述表达式,运算得到所述表达式的表达结果;生成提示将所述表达结果添加在已输入的文字中的提示信息。2.根据权利要求1所述的方法,其特征在于,所述将已输入的文字转化为表达式,包括:提取所述已输入的文字中的词语;利用预设的运算符集与所述词语的词向量进行运算,得到与所述词语之间的运算关系对应的运算符,所述运算符集包括运算符的词向量;根据所述词语和与所述词语之间的运算关系对应的运算符,生成表达式。3.根据权利要求1所述的方法,其特征在于,所述提取与所述已输入的文字对应的存储数据集合中的待测数据,包括:获取所述存储数据集合中的数据,并在所述数据中提取待测实体,所述待测实体为与所述表达式对应的数据;将与所述待测实体对应的值作为所述待测数据。4.根据权利要求1所述的方法,其特征在于,还包括:建立所述文字中的关联词语与所述存储数据集合中的所述待测数据的映射关系,所述关联词语包括所述表达式中的词语和/或所述表达结果;若更新所述存储数据集合中的所述待测数据,根据所述映射关系,更新与被更新的所述待测数据对应的所述文字中的关联词语;若更新所述文字中的关联词语,根据所述映射关系,更新与被更新的关联词语对应的所述存储数据集合中的所述待测数据。5.一种根据文本语义补充内容的装置,其特征在于,所述文本包括文字;所述装置包括:转化...

【专利技术属性】
技术研发人员:林得苗
申请(专利权)人:北京庖丁科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1