【技术实现步骤摘要】
文本信息的获取方法、装置、存储介质及计算机设备
本专利技术涉及通信
,尤其是涉及一种文本信息的获取方法、装置、存储介质及计算机设备。
技术介绍
在短信、推送、网络评论,文章摘要等文本信息当中,每个段落里都蕴含了丰富的信息,而针对单一的产品业务线或者业务场景,这些文本信息中只有部分信息才是有效的,所以,针对不同的产品业务线或者业务场景需要在文本信息中进行信息挖掘。目前,针对不同的产品业务线,通常根据单一维度的文本标签获取相应的文本信息。然而,单一维度的标签设计很难从多个角度考虑业务需求,因此无法对文本信息进行多维度的利用,由此造成产品业务线所需的文本信息缺失,后续针对文本信息的业务加工精度较低。
技术实现思路
本专利技术提供了一种文本信息的获取方法、装置、存储介质及计算机设备,主要在于能够全面地获取产品业务线所需的文本信息,对文本信息能够进行多维度的利用,提高了后续的业务加工精度。根据本专利技术的第一个方面,提供一种文本信息的获取方法,包括:接收文本信息的获取请求,所述获取请求 ...
【技术保护点】
1.一种文本信息的获取方法,其特征在于,包括:/n接收文本信息的获取请求,所述获取请求携带有业务的标识信息;/n根据所述标识信息,确定所述业务所需的多维度文本标签;/n根据所述多维度文本分类标签查询预设文本信息库,分别抓取所述业务所需的多维度文本信息。/n
【技术特征摘要】
1.一种文本信息的获取方法,其特征在于,包括:
接收文本信息的获取请求,所述获取请求携带有业务的标识信息;
根据所述标识信息,确定所述业务所需的多维度文本标签;
根据所述多维度文本分类标签查询预设文本信息库,分别抓取所述业务所需的多维度文本信息。
2.根据权利要求1所述的方法,其特征在于,在所述接收文本信息的获取请求之前,所述方法还包括:
获取原始文本数据和不同业务各自所需的多个分类维度;
根据所述多个分类维度对所述原始文本数据进行打标处理,得到所述不同业务所需的多维度文本信息;
将所述多维度文本信息按照其被标注的多维度文本标签分别存储至预设文本信息库。
3.根据权利要求2所述的方法,其特征在于,针对所述多个分类维度中的目标分类维度,根据所述目标分类维度对所述原始文本数据进行打标处理,得到所述不同业务所需的目标维度下的文本信息,包括:
根据所述目标分类维度构建预设自然语言分类模型,并利用所述预设自然语言分类模型对所述原始文本数据进行打标处理,得到所述不同业务所需的目标维度下的文本信息。
4.根据权利要求2所述的方法,其特征在于,针对所述多个分类维度中的实体分类维度,根据所述实体分类维度对所述原始文本数据进行打标处理,得到所述不同业务所需的实体维度下的文本信息,包括:
根据所述实体分类维度,构建预设实体字典和/或设定预设分类规则;
利用预设实体识别模型对所述原始文本数据进行实体识别,得到所述原始文本数据中存在的实体信息;
利用所述预设实体字典和/或所述预设分类规则对所述实体信息进行实体打标处理,得到所述不同业务所需的实体维度下的文本信息。
5.根据权利要求2所述的方法,其特征在于,针对所述...
【专利技术属性】
技术研发人员:赵秋博,
申请(专利权)人:大箴杭州科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。