The embodiment of the invention provides a classification model training and clause identification method and apparatus, including the training methods will have English clause English sentence set for training samples; the training sample is converted to text feature sequence; using the characteristics of text classification model for training sequence recognition English clauses. The type of automatic recognition of English sentences contain clauses, sentences English improves the diversity of information, reduce the user manual through comparing other information query English statement, not only can reduce the cost of time, improve efficiency, and to reduce the chance of error knowledge palm grip under the condition of less.
【技术实现步骤摘要】
本专利技术涉及计算机处理的
,特别是涉及一种英文从句的分类模型的训练方法、一种基于分类模型识别英文从句的方法和相应的一种英文从句的分类模型的训练装置、一种基于分类模型识别英文从句的装置。
技术介绍
随着全球化的发展,英语作为国际通用语言之一,已成为人们学习的基础学科之一。人们在阅读英文文章、观看英文电影时,遇到不懂的英文句子,大多数人都会借助翻译应用进行翻译。目前的翻译应用往往是对英文句子进行翻译,获得相应的含义,但是,对于具有学习目的的人们而言,尤其是学生,会对该英文语句具有其他需求,此时,需要人们人工通过查询其他资料对英文语句进行对比,不仅花费较多时间,导致效率较低,而且在对知识掌握较少的情况下容易出错。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种英文从句的分类模型的训练方法、一种基于分类模型识别英文从句的方法和相应的一种英文从句的分类模型的训练装置、一种基于分类模型识别英文从句的装置。依据本专利技术的一个方面,提供了一种英文从句的分类模型的训练方法,包括:将具有英文从句的英文句子设置为训练样本;将所述训练样本转换为特征文本序列;采用所述特征文本序列训练用于识别英文从句的分类模型。可选地,所述将所述训练样本转换为特征文本序列的步骤包括:识别所述训练样本的组成结构;采用所述组成结构形成特征序列文本。可选地,所述采用所述特征文本序列训练用于识别英文从句的分类模型的步骤包括:将所述特征文本序列输入卷积神经网络中;在所述卷积神经网络中基于所述训练样本中单词的顺序、采用所述特征文本序列训练用于识别英文 ...
【技术保护点】
一种英文从句的分类模型的训练方法,包括:将具有英文从句的英文句子设置为训练样本;将所述训练样本转换为特征文本序列;采用所述特征文本序列训练用于识别英文从句的分类模型。
【技术特征摘要】
1.一种英文从句的分类模型的训练方法,包括:将具有英文从句的英文句子设置为训练样本;将所述训练样本转换为特征文本序列;采用所述特征文本序列训练用于识别英文从句的分类模型。2.如权利要求1所述的方法,其特征在于,所述将所述训练样本转换为特征文本序列的步骤包括:识别所述训练样本的组成结构;采用所述组成结构形成特征序列文本。3.如权利要求1或2所述的方法,其特征在于,所述采用所述特征文本序列训练用于识别英文从句的分类模型的步骤包括:将所述特征文本序列输入卷积神经网络中;在所述卷积神经网络中基于所述训练样本中单词的顺序、采用所述特征文本序列训练用于识别英文从句的分类模型。4.一种基于分类模型识别英文从句的方法,包括:确定待识别的英文句子;将所述英文句子转换为特征文本序列;将所述特征文本序列输入预置的分类模型,以识别所述英文句子所包含的从句类型。5.如权利要求4所述的方法,其特征在于,所述从将所述英文句子转换为特征文本序列的步骤包括:识别所述英文句子的组成结构;采用所述组成结构形成特征序列文本。6.如权利要求5或6所述的方法,其特征在于,所述将所述特征文本序列输入预置的分类模型,以识别所述英文句子所包含的从句类型的步骤包括:将所述特征文本序列输入通...
【专利技术属性】
技术研发人员:郭祥,杨君,赵博洋,田东东,王思月,柴静,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。