【技术实现步骤摘要】
基于命名实体识别的模板生成、搜索及文本生成设备与方法
本专利技术涉及自然语言处理的
,具体地说,是一种基于命名实体识别的模板生成、搜索及文本生成设备与方法。
技术介绍
随着互联网技术的迅猛发展以及计算机技术的日新月异,越来越多的行业开始借助计算机及相关算法的力量,提高运行效率,实现产业升级。其中,自然语言处理技术(NLP)扮演者举足轻重的作用。自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向。它研究如何实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是一门涉及计算机科学、语言学、数学等的交叉学科。自然语言处理技术包含两个主要
:自然语言理解和自然语言生成。其中自然语言理解方向,主要是为了让计算机更好的“理解”人类的语言,例如基础的词法、句法、文法等。而自然语言生成方向,主要是为了让计算机能够自动生成人类能够理解的语言,例如自动摘要,文章生成等。目前的文本生成方法主要有基于语法的方法,基于统计的方法和基于模板对的方法。基于模板的方法经常被用来生成结构较为固定的文本情况。例如天气预报文本,通知消息文本等(“今天天气_,气温_摄氏度到 ...
【技术保护点】
1.一种文本模板生成器,其特征在于,所述一种文本模板生成器包括:文本预处理单元,对文本进行预处理;以及命名实体识别单元,用于根据命名实体识别技识别并标记文本中的相关实体,从而确定文本中需要被替换的词的位置,作为待替换位置;以及实体关系确定单元,用于根据语义分析及文法分析确定实体之间的关系,根据关系对实体进行分组,而每个实体对应模板中的一个待替换位置,由此便得到了包含若干组待替换位置的模板;以及辅助信息生成单元,用于根据规则生成相关辅助信息,用来辅助后面的搜索过程。
【技术特征摘要】
1.一种文本模板生成器,其特征在于,所述一种文本模板生成器包括:文本预处理单元,对文本进行预处理;以及命名实体识别单元,用于根据命名实体识别技识别并标记文本中的相关实体,从而确定文本中需要被替换的词的位置,作为待替换位置;以及实体关系确定单元,用于根据语义分析及文法分析确定实体之间的关系,根据关系对实体进行分组,而每个实体对应模板中的一个待替换位置,由此便得到了包含若干组待替换位置的模板;以及辅助信息生成单元,用于根据规则生成相关辅助信息,用来辅助后面的搜索过程。2.一种模板存取设备,包括:文本预处理单元,对文本进行预处理;以及模板存储单元,用于将生成的模板及相关辅助信息存入搜索引擎;以及模板搜索单元,用于根据输入的文本或关键词,按照一定的规则及文法,构造相应的搜索条件,搜索得到相关的模板。3.一种文本生成设备,包括:文本预处理单元,对文本进行预处理;以及文本生成单元,用于根据输入的文本或关键词,依据一定的规则及文法对模板进行替换,从而生成所需文本。4.根据权利要求...
【专利技术属性】
技术研发人员:郑翔,黄佳威,吴磊彬,吴君,任建新,徐雯斐,
申请(专利权)人:上海宝尊电子商务有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。