信息处理方法、装置、服务设备及计算机可读存储介质制造方法及图纸

技术编号：21399045 阅读：22 留言：0更新日期：2019-06-19 07:00

本申请实施例公开了一种信息处理方法、实现该方法的装置、服务设备和计算机可读存储介质。文本信息中的各个词的词权重可以用于评估该词在文本信息中的重要程度，但是采用当前方法计算得到的词的词权重与包含该词的文本信息之间的关联度较低，该词权重并不能准确地反映该词在该文本信息中的重要程度，使得词权重的准确度较低。采用本申请实施例，通过调用文本分析模型对文本信息进行分析识别，可以基于文本分析模型的输出结果确定文本信息的各个特征词的词权重值，即特征词的词权重值与对文本信息进行分析识别得到的输出结果之间的关联度较高，从而可以有效提高特征词的词权重值的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理方法、装置、服务设备及计算机可读存储介质
本申请涉及机器学习领域，具体涉及一种信息处理方法、装置、服务设备及计算机可读存储介质。
技术介绍
文本信息中的各个词的词权重可以用于评估该词在文本信息中的重要程度，应用于搜索系统、问答系统或者其他系统时，通过为文本信息中的词设置恰当的词权重，可以获得更加准确的处理结果。目前，主要采用词频-逆文本频率指数(TermFrequency–InverseDocumentFrequency，TF-IDF)计算词权重，TF-IDF算法的主要思想是：若某个词在一篇文档中出现的频率高，并且在其他文档中很少出现，则认为该词具有很好的类别区分能力，即该词的词权重较高。TF-IDF算法的缺陷在于词的词权重主要由文档集合中包含该词的文档数目所决定，该词的词权重与包含该词的文本信息之间的关联度较低，采用当前做法获得的词权重并不能准确地反映该词在该文本信息中的重要程度，使得词权重的准确度较低。因此，如何提高词权重的准确度成为一个亟待解决的技术问题。
技术实现思路
本申请实施例提供了一种信息处理方法、实现该方法的装置、服务设备及计算机可读存储介质，可以基于对文本信息进行分析识别得到的输出结果，确定文本信息中的特征词的词权重值，使得文本信息的特征词的词权重值与对该文本信息进行分析识别得到的输出结果之间的关联度较高，有利于提高特征词的词权重值的准确度。第一方面，本申请实施例提供了一种信息处理方法，该方法包括：获取文本信息；调用文本分析模型对文本信息进行分析识别，并获取文本分析模型的输出结果；根据输出结果，获取文本分析模型在分析识别时针对文本信息...

【技术保护点】
1.一种信息处理方法，其特征在于，所述方法包括：获取文本信息；调用文本分析模型对所述文本信息进行分析识别，并获取所述文本分析模型的输出结果；根据所述输出结果，获取所述文本分析模型在分析识别时针对所述文本信息中的各个特征词所使用的特征权重值；基于获取的各个特征权重值，确定所述文本信息中的各个特征词的词权重值。

【技术特征摘要】
1.一种信息处理方法，其特征在于，所述方法包括：获取文本信息；调用文本分析模型对所述文本信息进行分析识别，并获取所述文本分析模型的输出结果；根据所述输出结果，获取所述文本分析模型在分析识别时针对所述文本信息中的各个特征词所使用的特征权重值；基于获取的各个特征权重值，确定所述文本信息中的各个特征词的词权重值。2.根据权利要求1所述的方法，其特征在于，所述文本分析模型包括判别器，所述文本分析模型是通过所述判别器对所述文本信息进行分析识别的；所述根据所述输出结果，获取所述文本分析模型在分析识别时针对所述文本信息中的各个特征词所使用的特征权重值，包括：根据所述输出结果从所述文本分析模型包括的判别器中确定出目标判别器，并获取所述目标判别器在分析识别时针对所述文本信息中的各个特征词所使用的特征权重值。3.根据权利要求2所述的方法，其特征在于，所述文本分析模型为分类模型，所述文本分析模型包括多个判别器，每一个判别器对应一个分类类别；所述根据所述输出结果从所述文本分析模型包括的判别器中确定出目标判别器，包括：将与所述文本分析模型的输出结果包括的目标分类类别对应的判别器确定为目标判别器，其中，所述目标分类类别是根据所述文本分析模型的各个判别器对所述文本信息进行分析后得到的识别结果确定的。4.根据权利要求2所述的方法，其特征在于，所述文本分析模型包括多个判别器，每一个判别器进行分析识别的识别结果为一个概率值，所述输出结果包括目标概率值，所述目标概率值为所述文本分析模型的各个判别器输出的概率值中的最大概率值；所述根据所述输出结果从所述文本分析模型包括的判别器中确定出目标判别器，包括：将输出所述目标概率值的判别器确定为目标判别器。5.根据权利要求2所述的方法，其特征在于，所述文本分析模型包括多个判别器，每一个判别器对应一个标识；所述根据所述输出结果从所述文本分析模型包括的判别器中确定出目标判别器，包括：将与所述文本分析模型的输出结果包括的目标标识对应的判别器确定为目标判别器，其中，所述目标标识是根据所述文本分析模型的各个判别器对所述文本信息进行分析识别后得到的识别结果确定的。6.根据权利要求1～5任一项所述的方法，其特征在于，所述基于获取的各个特征权重值，确定所述文本信息中的各个特征词的词权重值，包括：将所述针对所述文本信息中的各个特征词所使用的特征权重值作为所述文本信息中的相应特征词的词权重值。7.根据权利要求3所述的方法，其特征在于，所述文本分析模型包括的各个判别器用于识别不同分类类别的文本信息，不同分类类别的文本信息中的同一特征词，在所述文本分析模型包括的不同判别器中的特征权重值不同。8.根据权利要求1～5任一项所述的方法，其特征在于，所述调用文本分析模型对所述文本信息进行分析识别，并获取所述文本分析模型的输出结果，包括：对所述文本信息进行分词处理，得到所述文本信息的各个特征词；将所述文本信息的各个特征词作为所述文本分析模型的输入，得到所述文本分析模型的输出结果。9.根据权利要求1～5任一项所述的方法，其特征在于，所述方法还包括：获取训练样本数据，所述训练样本数据包括历史文本信息和标注信息；基于所述历史文本信息和所述标注信息，对预设模型进行训练，得到所述文本分析模型。10.一种信息处理装置，其特征在于，所述装置包括：获取模块，用于获取文本信息；分析模块，用于调用文本分析模型对所述文本信息进行分析识别，并获取所述文本分析模型的输出结果；所述获取模块，还用于根据所述输出结果，获取所述文...

【专利技术属性】
技术研发人员：吴斌，蒋欣，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人