【技术实现步骤摘要】
本申请属于信息安全,尤其涉及一种目标文本信息的确定方法、装置、设备及计算机存储介质。
技术介绍
1、随着互联网及大数据的蓬勃发展,文本信息作为信息的存储载体随之不断涌现,文本语义分析成为各方关注的重点研究领域,其可以适用于多方面场景。
2、现有技术中,通常是采用简单的词频概率统计的方法,或者单一的机器学习方法进行文本信息语义分析。比如,构建同义词概念网络,存储频繁出现的前置词和后置词,确定文本相似度,进而确定文本信息是否异常;或者构建文本分析模型,依赖专家经验设置并调整各个文本类别标签的概率系数,对模型进行微调,基于各个文本类别标签的概率系数,获取分析结果,确定文本信息是否异常。
3、但是,基于词频概率统计的方法,在对大量的文本信息进行分析时,效率较低;基于文本分析模型对文本信息进行分析时,由于模型复杂度较高,也会存在效率较低的问题,而且模型参数依赖人工经验,还会影响分析结果的准确性。因此,现有的确定目标文本信息的方法,存在效率较低且准确性较低的问题。
技术实现思路
【技术保护点】
1.一种目标文本信息的确定方法, 其特征在于, 包括:获取文本信息集,所述文本信息集包括至少一条文本信息;基于关键词集, 识别第一文本信息中的关键词, 所述第一文本信息为所述至少一条文本信息中的任意一条;
2.根据权利要求1所述的目标文本信息的确定方法,其特征在于,所述关键词集包括第一关键词集和第二关键词集;所述基于关键词集, 识别第一文本信息中的关键词,包括:基于第一关键词集和第二关键词集, 识别所述第一文本信息中的第一关键词和第二关键词;
3.根据权利要求1或2所述的目标文本信息的确定方法, 其特征在于,在将所述第一文本信息输入至目标模型中
...【技术特征摘要】
1.一种目标文本信息的确定方法, 其特征在于, 包括:获取文本信息集,所述文本信息集包括至少一条文本信息;基于关键词集, 识别第一文本信息中的关键词, 所述第一文本信息为所述至少一条文本信息中的任意一条;
2.根据权利要求1所述的目标文本信息的确定方法,其特征在于,所述关键词集包括第一关键词集和第二关键词集;所述基于关键词集, 识别第一文本信息中的关键词,包括:基于第一关键词集和第二关键词集, 识别所述第一文本信息中的第一关键词和第二关键词;
3.根据权利要求1或2所述的目标文本信息的确定方法, 其特征在于,在将所述第一文本信息输入至目标模型中, 提取所述第一文本信息的特征,利用后验概率分布函数计算所述特征对应的第一文本信息的第一后验概率,将所述第一后验概率作为所述第一文本信息的模型权重之前, 所述方法还包括:
4.根据权利要求1所述的目标文本信息的确定方法,其特征在于,在获取文本信息集之前, 所述方法还包括:
5.根据权利要求1所述的目标文...
【专利技术属性】
技术研发人员:冮凯旋,刘冬岩,徐金阳,高琛,
申请(专利权)人:中国移动通信集团辽宁有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。