【技术实现步骤摘要】
一种自然语言分析处理平台
[0001]本专利技术数据挖掘、机器学习、人工智能及面向多语言文本分析技术应用领域,具体涉及一种自然语言分析处理平台。
技术介绍
[0002]随着互联网信息的蓬勃发展,需要对互联网信息中各种语言进行处理。自然语言处理(NLP)是计算机科学、人工智能、语言学所关注的计算机和人类(自然)语言之间相互作用的领域,是计算机科学领域与人工智能领域中的一个重要方向。自然语言处理研究范畴涵盖能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及到的领域包括自然语义理解、检索、信息抽取、机器翻译和自动问答系统等。
[0003]传统的机器学习算法例如SVM、LR等,对映射到高维空间的文本特征进行分析处理,当训练样本量大时,性能不好,同时会出现欠拟合情况。
[0004]因此,有必要提供一种新的自然语言处理平台,使得硬件算力的提高。
技术实现思路
[0005]解决的技术问题
[0006]针对现有技术所存在的上述缺点,本专利技术提供了一种自然语言分析处理平台,该平台将多个 ...
【技术保护点】
【技术特征摘要】
1.一种自然语言分析处理平台,其特征在于,包括数据池模块、话题类型选择模块和功能组件模块,所述数据池模块用于与第三方系统进行对接,获取自然语言数据;所述话题类型选择模块用于选择话题类型;所述功能组件模块用于选择自然语言分析模型;所述自然语言分析处理平台的交互平台可进行组件的自由组合,以实现所述数据池模块、所述话题类型选择模块和所述功能组件模块的自由组合,直观展示数据流向和分析结果。2.根据权利要求1所述的自然语言分析处理平台,其特征在于,所述功能组件模块融合多个自然语言分析模型,包括关键词提取模型、长文本摘要模型、情感分类模型、文本分类模型、命名实体识别模型和热词发现模型。3.根据权利要求2所述的自然语言分析处理平台,其特征在于,所述多个自然语言分析模型均采用BERT作为预训练模型,在专有的数据集上进行微调训练得到。4.根据权利要求3所述的自然语言分析处理平台,其特征在于,所述多个自然语言分析模型均采用docker容器技术部署,并提供提供Rest接口。5.根据权利要求1所述的自然语言分析处理平台,其特征在于,所述数据...
【专利技术属性】
技术研发人员:封晨,王鹏飞,金玉赫,吕晓钢,王通宇,
申请(专利权)人:天津光电通信技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。