基于机器学习的内容计算方法、装置及设备制造方法及图纸

技术编号:21571791 阅读:25 留言:0更新日期:2019-07-10 15:28
本申请实施例公开了一种基于机器学习的内容计算方法、装置及设备,属于计算机技术领域。所述方法包括:对待计算的内容进行分词运算,得到n个词汇,n为正整数;根据m个运算符和所述n个词汇生成语句向量,m为正整数;利用预先训练得到的编解码模型对所述语句向量进行处理,得到算数表达式;根据所述算数表达式计算所述内容的答案,所述算数表达式包括所述m个运算符中的至少一个运算符和所述内容中的至少两个数字。本申请实施例可以提高内容计算的准确性。

Content Computing Method, Device and Equipment Based on Machine Learning

【技术实现步骤摘要】
基于机器学习的内容计算方法、装置及设备
本申请实施例涉及计算机
,特别涉及一种基于机器学习的内容计算方法、装置及设备。
技术介绍
计算机可以对输入的内容进行处理后输出一个用于计算答案的算数表达式,该算数表达式包含运算符和该内容中的数字。通常,计算机是通过训练好的模型对内容进行计算的。比如,用户将内容“张姨用15元买了3双鞋,买5双鞋要多少元?”输入模型后,该模型输出算数表达式“15÷3×5”。相关技术中,模型先从内容中提取有效的数字,再根据基于单位设定的规则对数字进行排序,最后确定两两数字之间的运算符,得到一个算数表达式。当设定的规则不准确时,会影响算数表达式的准确性,从而影响内容计算的准确性。
技术实现思路
本申请实施例提供了一种基于机器学习的内容计算方法、装置及设备,用于解决设定的规则不准确时,影响内容计算的准确性的问题。所述技术方案如下:一方面,提供了一种基于机器学习的内容计算方法,所述方法包括:对待计算的内容进行分词运算,得到n个词汇,n为正整数;根据m个运算符和所述n个词汇生成语句向量,m为正整数;利用预先训练得到的编解码模型对所述语句向量进行处理,得到算数表达式;根据所述算数表达式计算所述内容的答案,所述算数表达式包括所述m个运算符中的至少一个运算符和所述内容中的至少两个数字。一方面,提供了一种基于机器学习的内容计算装置,所述装置包括:分词模块,用于对待计算的内容进行分词运算,得到n个词汇,n为正整数;生成模块,用于根据m个运算符和所述分词模块得到的所述n个词汇生成语句向量,m为正整数;所述生成模块,还用于利用预先训练得到的编解码模型对所述语句向量进行处理,得到算数表达式;计算模块,用于根据所述生成模块得到的所述算数表达式计算所述内容的答案,所述算数表达式包括所述m个运算符中的至少一个运算符和所述内容中的至少两个数字。一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的基于机器学习的内容计算方法。一方面,提供了一种内容计算设备,所述内容计算设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的基于机器学习的内容计算方法。本申请实施例提供的技术方案的有益效果至少包括:在根据m个运算符和对内容进行分词得到的n个词汇生成语句向量后,将该语句向量输入训练得到的编解码模型中,编解码模型可以输出算数表达式,再根据该算式表达式即可计算出内容的答案,由于编解码模型是训练得到的,无需人为设定规则,避免了设定的规则不准确时,影响算数表达式的准确性的问题,从而提高了内容计算的准确性。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据部分示例性实施例示出的一种内容计算系统的结构示意图;图2是本申请一个实施例提供的基于机器学习的内容计算方法的方法流程图;图3是本申请一个实施例提供的流程示意图;图4是本申请另一实施例提供的基于机器学习的内容计算方法的方法流程图;图5是本申请另一实施例提供的编解码模型的架构图;图6是本申请一个实施例提供的流程示意图;图7是本申请一个实施例提供的基于机器学习的内容计算装置的结构框图;图8是本申请再一实施例提供的服务器的结构框图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。下面对本申请涉及的应用场景进行介绍:本申请应用于基于机器学习的内容计算的应用场景中,这里所说的内容可以是应用题,也可以是其他包含数字的可计算的文本,本实施例不作限定。下面以内容是应用题为例,对涉及应用题的三种应用场景进行说明。第一种是儿童教辅类应用场景。本申请可以应用于儿童教辅类的产品中,比如,产品是习题解答产品,在习题是儿童数学应用题习题时,该产品可以批量生成习题的答案,减少人工生成习题的答案的成本,并提高生成习题的答案的效率。第二种是在线答疑类应用场景。本申请可以应用于在线答疑类的产品中,比如,产品是应用题在线答疑产品,该产品可以对用户输入的应用题进行实时解答。第三种是人工智能(ArtificialIntelligence,AI)聊天类应用场景。本申请可以应用于人工智能聊天系统的产品中,比如,产品是人工智能聊天机器人等等,该产品可以实时解答用户提出的应用题,以增加人工智能聊天机器人的智能性和趣味性。下面对本申请涉及的名词进行介绍:语句向量:语句向量是根据运算符和内容中的词汇生成的向量。其中,运算符可以是加“+”、减“-”、乘“×”、除“÷”、括号“(”和“)”等等,本实施例不作限定。词汇是对内容进行分词得到的,比如,内容为“张姨用15元买了3双鞋,买5双鞋要多少元?”,则词汇可以是“张阿姨”、“15”、“买”、“3”、“鞋”、“5”等等。由于需要利用编解码模型来对运算符和词汇进行处理,来得到算数表达式,而编解码模型无法识别运算符和词汇,所以,需要将运算符和词汇转换成编解码模型能够识别的向量。以上述6个运算符和6个词汇为例,假设6个运算符分别对应于词向量1-6,6个词汇分别对应于词向量7-12,则得到的语句向量=[词向量1、词向量2、词向量3、词向量4、词向量5、词向量6、词向量7、词向量8、词向量9、词向量10、词向量11、词向量12]。编解码模型:编解码模型是一种将输入的语句向量转换成算数表达式的机器学习模型。其中,算数表达式是根据运算符和内容中的数字生成的。仍然以上文的内容为例,则在将语句向量输入编解码模型后,编解码模型可以输出“15÷3×5”的算数表达式。需要说明的是,由于四则运算具有交换律、结合律、分配律等运算规则,所以,一个算数表达式可以有多种表现形式,所以,除了标准答案对应的算数表达式“15÷3×5”之外,编解码模型还可能生成“(15÷3)×5”、“5×(15÷3)”等等的算数表达式。本实施例中将标准答案对应的算数表达式称为第一表达式,将与第一表达式的计算结果相同且合法的算数表达式称为第二表达式。编解码模型包括编码模型和解码模型,编码模型用于对语句向量进行编码,得到编码向量;解码模型用于对编码向量进行解码,得到算数表达式,详见下文中的描述。本实施例中的编码模型提供了两种编码方式,第一种编码方式是对语句向量中的每个词向量(即词向量1-12)进行编码;第二种编码方式是对语句向量中与词汇对应的词向量(即词向量7-12)进行编码,本实施例不作限定。示意性的,若以第一种编码方式进行编码,且对一个词向量进行编码得到一个元素向量,则得到的编码向量=[元素向量1、元素向量2、元素向量3、元素向量4、元素向量5、元素向量6、元素向量7、元素向量8、元素向量9、元素向量10、元素向量11、元素向量12]。若以第二种编码方式进行编码,且对一个词向量进行编码得到一个元素向量,则得到的编码向量=[词向量1、词向量2、词向量3、词向量4、词向量5、词向量6、元素向量7、本文档来自技高网...

【技术保护点】
1.一种基于机器学习的内容计算方法,其特征在于,所述方法包括:对待计算的内容进行分词运算,得到n个词汇,n为正整数;根据m个运算符和所述n个词汇生成语句向量,m为正整数;利用预先训练得到的编解码模型对所述语句向量进行处理,得到算数表达式;根据所述算数表达式计算所述内容的答案,所述算数表达式包括所述m个运算符中的至少一个运算符和所述内容中的至少两个数字。

【技术特征摘要】
1.一种基于机器学习的内容计算方法,其特征在于,所述方法包括:对待计算的内容进行分词运算,得到n个词汇,n为正整数;根据m个运算符和所述n个词汇生成语句向量,m为正整数;利用预先训练得到的编解码模型对所述语句向量进行处理,得到算数表达式;根据所述算数表达式计算所述内容的答案,所述算数表达式包括所述m个运算符中的至少一个运算符和所述内容中的至少两个数字。2.根据权利要求1所述的方法,其特征在于,在所述对待计算的内容进行分词运算,得到n个词汇之前,所述方法还包括:提取所述待计算的内容中的各个数字,将各个数字替换成对应的替代符号;在所述根据所述算数表达式计算所述内容的答案之前,所述方法还包括:将所述算数表达式中的各个替代符号替换成对应的数字。3.根据权利要求1所述的方法,其特征在于,所述根据m个运算符和所述n个词汇生成语句向量,包括:将所述m个运算符和所述n个词汇进行组合,得到词序列;利用词向量矩阵对所述词序列中的每个元素进行映射,得到所述语句向量。4.根据权利要求1所述的方法,其特征在于,所述利用预先训练得到的编解码模型对所述语句向量进行处理,得到算数表达式,包括:利用所述编解码模型中的编码模型对所述语句向量进行编码,得到编码向量;利用所述编解码模型中的解码模型对所述编码向量进行解码,得到所述算数表达式。5.根据权利要求4所述的方法,其特征在于,当所述编码模型包括级联的k个第一处理节点,k为正整数,所述利用所述编解码模型中的编码模型对所述语句向量进行编码,得到编码向量,包括:利用所述k个第一处理节点中的第t个第一处理节点,获取所述语句向量中的第j个词向量,所述词向量对应于一个运算符或一个词汇,1≤t≤k,j=t或j=m+t;利用所述第t个第一处理节点,获取第t-1个第一处理节点输出的第t-1个隐态向量和第t-1个第一输出向量;利用所述第t个第一处理节点,对所述第j个词向量、所述第t-1个隐态向量和所述第t-1个第一输出向量进行运算,得到第t个隐态向量和第t个第一输出向量;当j=t时,将得到的m+n个隐态向量确定为所述编码向量;当j=m+t时,对所述语句向量中的前m个词向量和得到的n个隐态向量进行组合,得到所述编码向量。6.根据权利要求5所述的方法,其特征在于,所述解码模型包括级联的r个第二处理节点,r为正整数,所述利用所述编解码模型中的解码模型对所述编码向量进行解码,得到所述算数表达...

【专利技术属性】
技术研发人员:施隈隈陆笛牛成
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1