实体标准化方法、装置、电子设备、计算机可读存储介质制造方法及图纸

技术编号：35520462 阅读：20 留言：0更新日期：2022-11-09 14:39

本申请公开了一种实体标准化方法、装置、电子设备、计算机可读存储介质，该方法包括：接收用户的输入数据；基于所述输入数据与所述实体库的最长公共子序列构建评分函数，所述评分函数包括所述最长公共子序列中每个字的顺序关系；基于所述评分函数与所述输入数据从预设的字典树中，选择与所述输入数据最相似的实体数据；获取所述实体数据对应的实体词，作为所述输入数据对应的第一标准实体词。上述方案，可以提高实体标准化的准确性。可以提高实体标准化的准确性。可以提高实体标准化的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
实体标准化方法、装置、电子设备、计算机可读存储介质

[0001]本申请涉及数据处理
，特别是涉及一种实体标准化方法、装置、电子设备、计算机可读存储介质。

技术介绍

[0002]实体标准化是NLU(自然语言理解，Natural Language Understanding)在与业务结合时的重要步骤。例如用户在一段对话中输入“我的成长C收益有点低，有没有收益高一些的”，那么在常规的NLU过程中，先通过词槽识别，识别出用户输入文本中理财产品的词槽“我的成长C”，再将“我的成长C”标准化为当前理财产品库中的“天天成长C”。
[0003]标准化有多种策略，需要结合业务的需求进行设置。目前的相关技术中，实体化标准方法考虑不够全面，面对用户的输入疏漏，无法针对性的进行标准化处理，导致实体标准化不够准确。

技术实现思路

[0004]本申请至少提供一种实体标准化方法、装置、电子设备、计算机可读存储介质，用于解决相关技术中，实体化标准不够准确的问题。
[0005]本申请第一方面提供了一种实体标准化方法，包括：
[0006]接收用户的输入数据；
[0007]基于所述输入数据与所述实体库的最长公共子序列构建评分函数，所述评分函数包括所述最长公共子序列中每个字的顺序关系；
[0008]基于所述评分函数与所述输入数据从预设的字典树中，选择与所述输入数据最相似的实体数据；
[0009]获取所述实体数据对应的实体词，作为所述输入数据对应的第一标准实体词。
[0010]其中...

【技术保护点】

【技术特征摘要】
1.一种实体标准化方法，其特征在于，包括：接收用户的输入数据；基于所述输入数据与所述实体库的最长公共子序列构建评分函数，所述评分函数包括所述最长公共子序列中每个字的顺序关系；基于所述评分函数与所述输入数据从预设的字典树中，选择与所述输入数据最相似的实体数据；获取所述实体数据对应的实体词，作为所述输入数据对应的第一标准实体词。2.根据权利要求1所述的方法，其特征在于，所述字典树的构建步骤，包括：获取多个实体词及每个所述实体词的同义词；将每个所述实体词与其对应的所述同义词按照字顺序构建第一字典树；将每个所述实体词与其对应的所述同义词按照拼音顺序构建第二字典树；所述第一字典中的字与所述第二字典树中的拼音相对应；所述字典树包括所述第一字典树与所述第二字典树。3.根据权利要求2所述的方法，其特征在于，所述基于所述评分函数与所述输入数据从预设的字典树中，选择与所述输入数据最相似的实体数据，包括：基于所述评分函数与所述输入数据对所述第一字典树进行评分，得到携带有评分值的第一字典树；根据预设的搜索算法按照顺序依次从携带有评分值的第一字典树中，选取概率最大的字组合进行排列，得到所述实体数据。4.根据权利要求2所述的方法，其特征在于，所述基于所述评分函数与所述输入数据从预设的字典树中，选择与所述输入数据最相似的实体数据，包括：基于所述评分函数与所述输入数据对所述第二字典树进行评分，得到携带有评分值的第二字典树；根据预设的搜索算法按照顺序依次从携带有评分值的第二字典树中，选取概率最大的字组合进行排列，得到所述实体数据。5.根据权利要求2所述的方法，其特征在于，所述基于所述评分函数与所述输入数据从预设的字典树中，选择与所述输入数据最相似的实体数据之后，所述方法还包括：当所述字典树中不存在所述实体数据时，根据所...

【专利技术属性】
技术研发人员：顾晟，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人