【技术实现步骤摘要】
一种判断替代词语含义的方法、系统、终端及存储介质
[0001]本申请涉及数据处理
,尤其是涉及一种判断替代词语含义的方法、系统、终端及存储介质。
技术介绍
[0002]在一些团体中,为了高效的交流和沟通,常在团体内部使用一些特殊词语代替常用语,例如公司内部派遣人员出差,常用语是“谁有空安排一下本次出差任务”,而可以采用特殊词语“谁顶上”来代替。
[0003]由于是团体内部约定的替代语,公众若想获知该替代语表达的实际含义,不仅需要大量人工研判和甄别,还需要耗费大量的时间。同时,对于社会中存在的各种各样的团体,若想都获知其内部约定的替代语,不仅会耗费大量的人力资源和时间成本,且由于时效性,最终判断出的替代语的实际含义可能早已更换,导致判断成本成量级增加。
技术实现思路
[0004]本申请提供一种判断替代词语含义的方法、系统、终端及存储介质,具有降低判断代替词语实际含义的成本的特点。
[0005]本申请目的一是提供一种判断替代词语含义的方法。
[0006]本申请的上述申请目的一是通过以 ...
【技术保护点】
【技术特征摘要】
1.一种判断替代词语含义的方法,其特征在于,包括:获取目标代替词语,所述目标代替词语为出现频率呈下降趋势的代替词语;将目标代替词语从开始出现至结束时刻之间的时间段设定为监控时段,在所述监控时段内,将出现频率呈上升趋势的词语标记为待测词语;提取目标代替词语的关联词语;提取待测词语的关联词语;计算目标代替词语的关联词语与待测词语的关联词语的差异度值;将所述差异度值最小的待测词语作为目标代替词语的同义词语。2.根据权利要求1所述的判断替代词语含义的方法,其特征在于,所述获取目标代替词语之前,还包括:从网络中爬取公开的代替词语;将所述代替词语放入备选语库中。3.根据权利要求1所述的判断替代词语含义的方法,其特征在于,所述计算目标代替词语的关联词语与待测词语的关联词语的差异度值包括:将目标代替词语的关联词语按照出现的先后顺序进行排列得到第一序列;将待测词语的关联词语按照出现的先后顺序进行排列得到第二序列;判断第一序列和第二序列是否一致;若是,则差异度值为零;若否,则采用预设的计算模型计算第一序列和第二序列的差异度值。4.根据权利要求3所述的判断替代词语含义的方法,其特征在于,所述采用预设的计算模型计算第一序列和第二序列的差异度值包括:采用词频逆文档频率模型剔除第一序列中无效的词句得到第一有效序列;采用词频逆文档频率模型剔除第二序列中无效的词句得到第二有效序列;采用词向量模型计算第一有效序列和第二有效序列的差异度值;采用文档向量模型计算第一有效序列和第二有效序列的差异度值;合并依据词向量模型得到的差异度值和文档向量模型得到的差异度值。5.根据权利要求4所述的判断替代词语含义的方法,其特征在于,所述采用词向量模型计算第一有效序列和第二有效序列的差异度值包括:根据第一有效序列确定第一同义词序列;根据第二有效序列确定第二同义词序列;判断第一同义词序列和第二同义词序列是否完全一致...
【专利技术属性】
技术研发人员:徐涛,吴楠,胡大明,蒋修强,卢小军,王金涛,王方舟,
申请(专利权)人:北京码牛科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。