一种分类模型的训练及其从句识别方法和装置制造方法及图纸

技术编号:15299952 阅读:74 留言:0更新日期:2017-05-12 02:18
本发明专利技术实施例提供了一种分类模型的训练及其从句识别方法和装置,该训练方法包括:将具有英文从句的英文句子设置为训练样本;将所述训练样本转换为特征文本序列;采用所述特征文本序列训练用于识别英文从句的分类模型。使得可以自动识别英文句子所包含的从句的类型,提高了英文句子的信息多样性,减少用户人工通过查询其他资料对英文语句进行对比,不仅可以减少花费的时间,提高效率,而且,在对知识掌握较少的情况下减少出错的几率。

Classification model training and subordinate clause identification method and device thereof

The embodiment of the invention provides a classification model training and clause identification method and apparatus, including the training methods will have English clause English sentence set for training samples; the training sample is converted to text feature sequence; using the characteristics of text classification model for training sequence recognition English clauses. The type of automatic recognition of English sentences contain clauses, sentences English improves the diversity of information, reduce the user manual through comparing other information query English statement, not only can reduce the cost of time, improve efficiency, and to reduce the chance of error knowledge palm grip under the condition of less.

【技术实现步骤摘要】

本专利技术涉及计算机处理的
,特别是涉及一种英文从句的分类模型的训练方法、一种基于分类模型识别英文从句的方法和相应的一种英文从句的分类模型的训练装置、一种基于分类模型识别英文从句的装置。
技术介绍
随着全球化的发展,英语作为国际通用语言之一,已成为人们学习的基础学科之一。人们在阅读英文文章、观看英文电影时,遇到不懂的英文句子,大多数人都会借助翻译应用进行翻译。目前的翻译应用往往是对英文句子进行翻译,获得相应的含义,但是,对于具有学习目的的人们而言,尤其是学生,会对该英文语句具有其他需求,此时,需要人们人工通过查询其他资料对英文语句进行对比,不仅花费较多时间,导致效率较低,而且在对知识掌握较少的情况下容易出错。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种英文从句的分类模型的训练方法、一种基于分类模型识别英文从句的方法和相应的一种英文从句的分类模型的训练装置、一种基于分类模型识别英文从句的装置。依据本专利技术的一个方面,提供了一种英文从句的分类模型的训练方法,包括:将具有英文从句的英文句子设置为训练样本;将所述训练样本转换为特征文本序列;采用所述特征文本序列训练用于识别英文从句的分类模型。可选地,所述将所述训练样本转换为特征文本序列的步骤包括:识别所述训练样本的组成结构;采用所述组成结构形成特征序列文本。可选地,所述采用所述特征文本序列训练用于识别英文从句的分类模型的步骤包括:将所述特征文本序列输入卷积神经网络中;在所述卷积神经网络中基于所述训练样本中单词的顺序、采用所述特征文本序列训练用于识别英文从句的分类模型。根据本专利技术的另一方面,提供了一种基于分类模型识别英文从句的方法,包括:确定待识别的英文句子;将所述英文句子转换为特征文本序列;将所述特征文本序列输入预置的分类模型,以识别所述英文句子所包含的从句类型。可选地,所述从将所述英文句子转换为特征文本序列的步骤包括:识别所述英文句子的组成结构;采用所述组成结构形成特征序列文本。可选地,所述将所述特征文本序列输入预置的分类模型,以识别所述英文句子所包含的从句类型的步骤包括:将所述特征文本序列输入通过卷积神经网络训练的分类模型中;在所述分类模型中基于所述英文句子中单词的顺序、采用所述特征文本序列识别所述英文句子所包含的从句类型。根据本专利技术的另一方面,提供了一种英文从句的分类模型的训练装置,包括:训练样本设置模块,适于将具有英文从句的英文句子设置为训练样本;训练样本转换模块,适于将所述训练样本转换为特征文本序列;分类模型训练模块,适于采用所述特征文本序列训练用于识别英文从句的分类模型。可选地,所述训练样本转换模块包括:样本结构识别子模块,适于识别所述训练样本的组成结构;样本特征形成子模块,适于采用所述组成结构形成特征序列文本。可选地,所述分类模型训练模块包括:卷积神经网络输入子模块,适于将所述特征文本序列输入卷积神经网络中;卷积神经网络训练子模块,适于在所述卷积神经网络中基于所述训练样本中单词的顺序、采用所述特征文本序列训练用于识别英文从句的分类模型。根据本专利技术的另一方面,提供了一种基于分类模型识别英文从句的装置,包括:英文句子确定模块,适于确定待识别的英文句子;英文句子转换模块,适于将所述英文句子转换为特征文本序列;从句类型识别模块,适于将所述特征文本序列输入预置的分类模型,以识别所述英文句子所包含的从句类型。可选地,所述英文句子转换模块包括:句子结构识别子模块,适于识别所述英文句子的组成结构;句子特征形成子模块,适于采用所述组成结构形成特征序列文本。可选地,所述从句类型识别模块包括:分类模型输入子模块,适于将所述特征文本序列输入通过卷积神经网络训练的分类模型中;分类模型识别子模块,适于在所述分类模型中基于所述英文句子中单词的顺序、采用所述特征文本序列识别所述英文句子所包含的从句类型。本专利技术实施例将具有英文从句的英文句子设置为训练样本并转换为特征文本序列,采用该特征文本序列训练用于识别英文从句的分类模型,使得可以自动识别英文句子所包含的从句的类型,提高了英文句子的信息多样性,减少用户人工通过查询其他资料对英文语句进行对比,不仅可以减少花费的时间,提高效率,而且,在对知识掌握较少的情况下减少出错的几率。本专利技术实施例将英文句子转换为特征文本序列并输入预置的分类模型,以识别英文句子所包含的从句类型,实现自动识别英文句子所包含的从句的类型,提高了英文句子的信息多样性,减少用户人工通过查询其他资料对英文语句进行对比,不仅可以减少花费的时间,提高效率,而且,在对知识掌握较少的情况下减少出错的几率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的一种英文信息的识别方法的步骤流程图;图2A-图2E示出了根据本专利技术一个实施例的一种英文句子的识别操作示例图;图3示出了根据本专利技术一个实施例的另一种英文信息的识别方法的步骤流程图;图4示出了根据本专利技术一个实施例的一种英文从句的分类模型的训练方法的步骤流程图;图5示出了根据本专利技术一个实施例的一种组成结构的识别示例图;图6示出了根据本专利技术一个实施例的一种基于分类模型识别英文从句的方法的步骤流程图;图7示出了根据本专利技术一个实施例的一种英文信息的识别装置的结构框图;图8示出了根据本专利技术一个实施例的另一种英文信息的识别装置的结构框图;图9示出了根据本专利技术一个实施例的一种英文从句的分类模型的训练装置的结构框图;以及图10示出了根据本专利技术一个实施例的一种基于分类模型识别英文从句的装置的结构框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。参照图1,示出了根据本专利技术一个实施例的一种英文信息的识别方法的步骤流程图,具体可以包括如下步骤:步骤101,选择目标图像数据。在具体实现中,本专利技术实施例可以应用于移动终端中,例如,手机、PDA(PersonalDigitalAssistant,个人数字助理)、膝上型计算机、掌上电脑等等,本专利技术实施例对此不加以限制。这些移动终端可以安装Windows、Android(安卓)、IOS、WindowsPhone等操作系统,在这些操作系统中,可以安装英文识别应用,以进行英文信息的识别,该英文识别应用可以为操作系统中的系统应用,也可以为第三方应用。在本专利技术实施例中,英文识别应用可以依据用户的操作指令,选择记载有英文信息的目标图像数据,以待进行识别。在具体实现中,英文识别应用可以通过如下方式选择目标图像数据:一、拍摄。在此方式中,移动终端配置有摄像头本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201611250331.html" title="一种分类模型的训练及其从句识别方法和装置原文来自X技术">分类模型的训练及其从句识别方法和装置</a>

【技术保护点】
一种英文从句的分类模型的训练方法,包括:将具有英文从句的英文句子设置为训练样本;将所述训练样本转换为特征文本序列;采用所述特征文本序列训练用于识别英文从句的分类模型。

【技术特征摘要】
1.一种英文从句的分类模型的训练方法,包括:将具有英文从句的英文句子设置为训练样本;将所述训练样本转换为特征文本序列;采用所述特征文本序列训练用于识别英文从句的分类模型。2.如权利要求1所述的方法,其特征在于,所述将所述训练样本转换为特征文本序列的步骤包括:识别所述训练样本的组成结构;采用所述组成结构形成特征序列文本。3.如权利要求1或2所述的方法,其特征在于,所述采用所述特征文本序列训练用于识别英文从句的分类模型的步骤包括:将所述特征文本序列输入卷积神经网络中;在所述卷积神经网络中基于所述训练样本中单词的顺序、采用所述特征文本序列训练用于识别英文从句的分类模型。4.一种基于分类模型识别英文从句的方法,包括:确定待识别的英文句子;将所述英文句子转换为特征文本序列;将所述特征文本序列输入预置的分类模型,以识别所述英文句子所包含的从句类型。5.如权利要求4所述的方法,其特征在于,所述从将所述英文句子转换为特征文本序列的步骤包括:识别所述英文句子的组成结构;采用所述组成结构形成特征序列文本。6.如权利要求5或6所述的方法,其特征在于,所述将所述特征文本序列输入预置的分类模型,以识别所述英文句子所包含的从句类型的步骤包括:将所述特征文本序列输入通...

【专利技术属性】
技术研发人员:郭祥杨君赵博洋田东东王思月柴静
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1