【技术实现步骤摘要】
文本的专有名词处理方法、装置和计算机设备
本申请涉及计算机
,特别是涉及一种文本的专有名词处理方法、装置、计算机设备和存储介质。
技术介绍
随着互联网技术的不断发展,很多业务都是通过互联网完成。如:用户需要进行问卷调查时,如果调查问卷涉及专业问题,会包含有很多专业术语和名词的内容,用户不一定明白是什么意思,会导致用户答非所问。为了使用户在答题过程中能够清楚文本中的专业术语和名词,在用户答题之前,提前将文本中的专有名词通过人工的方式挑选出来,进行标记,通过人工的方式将专有名词的解释内容或链接与文本中的专有名词进行关联。这往往需要大量的人力来做人工标记和url的添加,工作效率低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高工作效率的文本的专有名词处理方法、装置、计算机设备和存储介质。一种文本的专有名词处理方法,所述方法包括:获取专有名词标记指令;根据所述专有名词标记指令获取各待标记的文本;基于数据库中的专有词库对各所述待标记的文本进行分析,提取各所述待标记的文本的专有名词;将各所述待标记的文本的专有名词进行标记;当接收到用户通过终端触发文本中标记 ...
【技术保护点】
1.一种文本的专有名词处理方法,所述方法包括:获取专有名词标记指令;根据所述专有名词标记指令获取各待标记的文本;基于数据库中的专有词库对各所述待标记的文本进行分析,提取各所述待标记的文本的专有名词;将各所述待标记的文本的专有名词进行标记;当接收到用户通过终端触发文本中标记的所述专有名词的解释请求时,根据所述解释请求获取访问地址;通过正则表达式对所述访问地址中的页面内容进行爬取,获得所述专有名词的解释信息。
【技术特征摘要】
1.一种文本的专有名词处理方法,所述方法包括:获取专有名词标记指令;根据所述专有名词标记指令获取各待标记的文本;基于数据库中的专有词库对各所述待标记的文本进行分析,提取各所述待标记的文本的专有名词;将各所述待标记的文本的专有名词进行标记;当接收到用户通过终端触发文本中标记的所述专有名词的解释请求时,根据所述解释请求获取访问地址;通过正则表达式对所述访问地址中的页面内容进行爬取,获得所述专有名词的解释信息。2.根据权利要求1所述的方法,其特征在于,所述基于数据库中的专有词库对各所述待标记的文本进行分析,提取各所述待标记的文本的专有名词的步骤,包括:对所述待标记的文本进行分词处理,获取各词语;获取各所述词语与所述专有词库中的专有名词的交集;将交集中的词语确定为各所述待标记的文本中的专有名词。3.根据权利要求1所述的方法,其特征在于,所述专有词库的建立方式包括:通过大数据获取与所述待标记的文本内容相关的文本;对所述待标记的文本内容相关的文本中的内容进行分词处理,获得各待分析词语;对各所述待分析词语进行分析,确定专有名词;将各所述专有名词保存到专有词库中。4.根据权利要求3所述的方法,其特征在于,所述对各所述待分析词语进行分析,确定专有名词的步骤,包括:获取搜索引擎的搜索数据;获取根据搜索数据中的搜索词与各所述待分析词语的交集;将交集中的各所述待分析词语确定为专有名词。5.根据权利要求4所述的方法,其特征在于,所述对各所述待分析词语进行分析,确定专有名词的步骤,还包括:对未在交集中的所述搜索词进行分析,确定所述搜索词的搜索次数;将所述搜索次数大于预设次数的搜索词确定为专有名词。6....
【专利技术属性】
技术研发人员:许剑勇,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。