模型的生成方法及装置、重要度获取方法及装置制造方法及图纸

技术编号：11356684 阅读：74 留言：0更新日期：2015-04-29 08:02

本发明专利技术实施例提供了一种模型的生成方法及装置、重要度获取方法及装置。一方面，本发明专利技术实施例通过依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，M为大于0的整数；从而，利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值；进而，利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，将所述目标模型输出值所对应的候选模型作为目标模型。因此，本发明专利技术实施例提供的技术方案能够可以解决现有技术中获得词条的重要度信息的模型的可靠性比较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
模型的生成方法及装置、重要度获取方法及装置
本专利技术涉及计算机应用
，尤其涉及一种模型的生成方法及装置、重要度获取方法及装置。
技术介绍
对于给定的文本，准确地计算出其中每个词条的重要度，进而可以应用于后续的搜索或者语义分析等。例如，搜索场景下，用户输入查询文本时，该查询文本中包含若干词条，其中会存在冗余词条，如果用真个查询文本进行搜索，会影响搜索效率以及降低搜索结果的质量。因此，需要对查询文本中的词条进行重要度计算，然后利用其中重要度较高的一些词条去进行搜索，去掉其中的冗余词条。现有技术中，有能够依据给定的词条输出重要度或者重要度排序的模型，这些模型能够保证输出的词条的重要度的数值的准确性，或者能够保证属于同一个文本的两个词条之间的重要度排序的准确性。然而，如果既需要获得词条的重要度的数值，同时还需要词条的重要度排序，那么目前的模型都无法满足，另外，也不能够获得词条的重要度的其他信息，如词条的重要度之间的区分度、重要度的取值范围等，因此，目前用于获取词条的重要度信息的模型的可靠性比较低。
技术实现思路
有鉴于此，本专利技术实施例提供了一种模型的生成方法及装置、重要度获取方法及装置，可以解决现有技术中获得词条的重要度信息的模型的可靠性比较低的问题。本专利技术实施例的一方面，提供一种模型的生成方法，包括：依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，M为大于0的整数；利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值；利用评估模型对所述M个归一化的候选模型输出值进行评估，以...
模型的生成方法及装置、重要度获取方法及装置

【技术保护点】
一种模型的生成方法，其特征在于，所述方法包括：依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，M为大于0的整数；利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值；利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，将所述目标模型输出值所对应的候选模型作为目标模型。

【技术特征摘要】
1.一种模型的生成方法，其特征在于，所述方法包括：依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，M为大于0的整数；利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值；利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，将所述目标模型输出值所对应的候选模型作为目标模型；所述利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值，包括：利用所述M个候选模型，获得所述词条的M个候选模型输出值；依据所述词条的每个候选模型输出值、所述词条所在文本中其他词条的候选模型输出值，获得所述词条的M个归一化的候选模型输出值。2.根据权利要求1所述的方法，其特征在于，所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型之前，所述方法还包括：利用初始模型，获得所述词条的初始模型输出值；依据所述词条的初始模型输出值以及所述词条所在文本中其他词条的初始模型输出值，获得所述词条的归一化的初始模型输出值；依据所述词条的归一化的初始模型输出值，获得所述词条的重要度准确率；和/或，依据所述词条的归一化的初始模型输出值或者所述词条的初始模型输出值，获得所述词条之间的排序准确率；和/或，依据所述词条的归一化的初始模型输出值，获得所述词条之间的区分度准确率。3.根据权利要求1或2所述的方法，其特征在于，所述词条的重要度准确率的数目为N个，所述词条之间的排序准确率的数目为P个，词条之间的区分度准确率的数目为Q个，N、P和Q均为0或者正整数，且不同时为0，且N、P和Q中至少一个大于或者等于2，所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，包括：依据所述词条的重要度准确率、所述词条之间的排序准确率和所述词条之间的区分度准确率中至少一个，获得K个目标准确率，K为大于1且小于或等于的整数；依据所述K个目标准确率，对初始模型的第一模型参数进行调整，以获得M个第二模型参数；依据所述M个第二模型参数，构建所述M个候选模型。4.根据权利要求3所述的方法，其特征在于，所述依据所述K个目标准确率，对初始模型的第一模型参数进行调整，以获得M个第二模型参数，包括：依据所述K个目标准确率以及预设的准确率阈值，获得大于或者等于所述准确率阈值的M个目标准确率；对所述M个目标准确率中的每个所述目标准确率分别进行求导运算，以获得M个梯度值；依据所述M个梯度值中每个所述梯度值，分别对所述初始模型的第一模型参数进行调整，以获得M个第二模型参数。5.根据权利要求1所述的方法，其特征在于，所述评估模型包括所述词条所在文本中所有词条的标准输出值，所述利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，包括：针对每个所述候选模型，确定所述文本中归一化的候选模型输出值最高的K个词条；确定所述文本中所述标准输出值最高的R个词条，R为大于K的整数；依据所述文本中归一化的候选模型输出值最高的K个词条、所述文本中所述标准输出值最高的R个词条，获得每个所述归一化的候选模型输出值的评估结果；依据所述评估结果，从所述M个归一化的候选模型输出值中选出一个归一化的候选模型输出值，以作为所述目标模型输出值。6.一种重要度的获取方法，其特征在于，所述方法包括：获得待处理文本；对所述待处理文本进行切词处理，以获得至少一个词条；利用目标模型，获得所述至少一个词条中每个所述词条的目标模型输出值，以作为每个所述词条的重要度；...

【专利技术属性】
技术研发人员：石磊，连荣忠，张鹏，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人