【技术实现步骤摘要】
【专利摘要】本专利技术提出了,根据文本的语义对文本进行分类,包括以下步骤:A、根据文本集选择预设词典组合构建本体库;B、将文本集统一格式并分解为基本单元,根据本体库将文本集转化为概念;C、抽取文本集的特征项,并计算特征项的权重;D、根据预设训练集构建分类器,并根据预设测试集对分类器进行测试和调整;E、根据分类器对文本集进行分类。本专利技术提出的基于语义的文本分类方法,根据文本的语义对文本进行分类,可达到理想的分类效果,而且效率高。【专利说明】
本专利技术涉及文本信息智能检索
,尤其涉及。
技术介绍
文本分类技术在很多领域都有应用,例如,将文本进行分类,分类后的文本用于指导机器翻译中翻译模型的训练,可见,文本分类的精度很重要,精度高的分类文本,可以在其应用领域带来有益效果,而如果文本分类的精度不够,就会给使用这些分类文本的应用带来不利影响。 在现有的文本分类方法中,通常采用训练语料进行分类器训练,然后用训练后的分类器对文本进行分类的方式进行。这种方式下,首先,获取大量标注的训练语料存在困难,如果采用大规模手工标注,则效率低下,其次 ...
【技术保护点】
一种基于语义的文本分类方法,其特征在于,根据文本的语义对文本进行分类,包括以下步骤:A、根据文本集选择预设词典组合构建本体库;B、将文本集统一格式并分解为基本单元,根据本体库将文本集转化为概念;C、抽取文本集的特征项,并计算特征项的权重;D、根据预设训练集构建分类器,并根据预设测试集对分类器进行测试和调整;E、根据分类器对文本集进行分类。
【技术特征摘要】
【专利技术属性】
技术研发人员:贾岩,
申请(专利权)人:安徽华贞信息科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。