应用程序接口确定方法、装置、计算机设备、存储介质制造方法及图纸

技术编号:37563683 阅读:10 留言:0更新日期:2023-05-15 07:44
本公开涉及一种应用程序接口确定方法、装置、计算机设备、存储介质。涉及大数据数据处理技术领域,所述方法包括:获取多个待处理文本数据,所述待处理文本数据为应用程序接口的功能描述文本;利用关键词提取算法确定每个所述待处理文本数据中的摘要;利用预先训练完成的词向量模型对每个所述待处理文本数据的摘要进行处理,得到每个待处理文本数据中所述摘要的嵌入值;根据每个待处理文本数据中所述摘要的嵌入值,确定目标应用程序接口。采用本方法能够不受到文本中无关的信息影响,准确地生成文本嵌入值,进而正确的找到符合要求的API服务。务。务。

【技术实现步骤摘要】
应用程序接口确定方法、装置、计算机设备、存储介质


[0001]本公开涉及大数据数据处理
,特别是涉及一种应用程序接口确定方法、装置、计算机设备、存储介质。

技术介绍

[0002]随着大数据的发展,出现了大量的API,如何挑选、推荐、组合API(Application Programming Interface)服务成了一个难题。无论是服务挑选、服务组合还是服务推荐问题,在处理时都无法绕过将服务的信息向量化(即嵌入)。API服务本身的信息除了基础的参数等数值信息以外,还有功能描述类文本信息,文本信息在用于计算时,必须先表示为向量。计算一个准确的、能够反映API服务的功能信息的文本嵌入值有助于服务挑选、服务组合、服务推荐的工作。
[0003]然而,目前大部分API服务的功能描述文本中通常存在一些与功能无关的其他信息。如果直接使用文本嵌入的处理方法,则无法过滤到这些无关的信息。导致生成的文本嵌入值不准确,进而无法正确的找到符合要求的API服务。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够不受到文本中无关的信息影响,准确地生成文本嵌入值的应用程序接口确定方法、装置、计算机设备、存储介质。
[0005]第一方面,本公开提供了一种应用程序接口确定方法。所述方法包括:
[0006]获取多个待处理文本数据,所述待处理文本数据为应用程序接口的功能描述文本;
[0007]利用关键词提取算法确定每个所述待处理文本数据中的摘要;
[0008]利用预先训练完成的词向量模型对每个所述待处理文本数据的摘要进行处理,得到每个待处理文本数据中所述摘要的嵌入值;
[0009]根据每个待处理文本数据中所述摘要的嵌入值,确定目标应用程序接口。
[0010]在其中一个实施例中,所述利用关键词提取算法确定每个所述待处理文本数据中的摘要,包括:
[0011]将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值;
[0012]根据每个所述文本句的权重值,确定每个所述待处理文本数据的摘要。
[0013]在其中一个实施例中,所述将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值,包括:
[0014]响应于所述文本句中未存在代表词典中的代表词语,利用关键词提取算法计算每个所述文本句的第一权重值,其中,所述代表词典为与所述待处理文本对应的应用程序接口的功能类别相同的词典;所述代表词典的生成过程包括:根据多个功能类别对应的文本数据的第一常用词集合、每个功能类别对应的文本数据中第二常用词集合,确定每个功能
类别对应的代表词典。
[0015]在其中一个实施例中,所述将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值,还包括:
[0016]响应于所述文本句中存在代表词典中的代表词语,利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值。
[0017]在其中一个实施例中,所述利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值,包括:
[0018]计算所述代表词语在所述文本句中的代表权重值;
[0019]将所述代表权重值与所述第一权重进行相加,确定所述文本句的第二权重值。
[0020]在其中一个实施例中,所述代表词典的生成过程进一步包括:
[0021]统计多个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定多个功能类别对应的文本数据中第一常用词集合;
[0022]统计每个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定每个功能类别对应的文本数据中第二常用词集合;
[0023]在所述第二常用词集合中删除与所述第一常用词集合中的相同的词语,得到每个功能类别对应的代表词典。
[0024]在其中一个实施例中,所述统计多个功能类别对应的文本数据中的词语和每个词语对应的词频,确定多个功能类别对应的文本数据中第一常用词集合之前,所述方法还包括:
[0025]删除多个功能类别的应用程序接口的功能描述文本中的停用词,其中,所述停用词包括:没有实际意义的词语。
[0026]在其中一个实施例中,所述利用关键词提取算法计算每个所述文本句的第一权重值,包括:
[0027]分别计算每个所述文本句之间的权重值;
[0028]响应于所述权重值大于预设的权重阈值,确定所述权重值对应的文本句之间的边;
[0029]根据每个所述文本句之间的权重值和所述文本句之间的边,确定每个所述文本句的第一权重值。
[0030]第二方面,本公开还提供了一种应用程序接口确定装置。所述装置包括:
[0031]数据获取模块,用于获取多个待处理文本数据,所述待处理文本数据为应用程序接口的功能描述文本;
[0032]摘要提取模块,用于利用关键词提取算法确定每个所述待处理文本数据中的摘要;
[0033]嵌入值计算模块,用于利用预先训练完成的词向量模型对每个所述待处理文本数据的摘要进行处理,得到每个待处理文本数据中所述摘要的嵌入值;
[0034]应用程序接口确定模块,用于根据每个待处理文本数据中所述摘要的嵌入值,确定目标应用程序接口。
[0035]在所述装置的其中一个实施例中,所述摘要提取模块,包括:权重值计算模块,用于将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本
句的权重值;
[0036]摘要确定模块,用于根据每个所述文本句的权重值,确定每个所述待处理文本数据的摘要。
[0037]在所述装置的其中一个实施例中,所述权重值计算模块包括:第一权重值计算模块,用于响应于所述文本句中未存在代表词典中的代表词语,利用关键词提取算法计算每个所述文本句的第一权重值,其中,所述代表词典为与所述待处理文本对应的应用程序接口的功能类别相同的词典;所述代表词典的生成过程包括:根据多个功能类别对应的文本数据的第一常用词集合、每个功能类别对应的文本数据中第二常用词集合,确定每个功能类别对应的代表词典。
[0038]在所述装置的其中一个实施例中,所述权重值计算模块还包括:第二权重值计算模块,用于响应于所述文本句中存在代表词典中的代表词语,利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值。
[0039]在所述装置的其中一个实施例中,所述装置还包括所述第二权重值计算模块,包括:代表权重值计算模块,用于计算所述代表词语在所述文本句中的代表权重值;
[0040]权重值计算子模块,用于将所述代表权重值与所述第一权重进行相加,确定所述文本句的第二权重值。
[0041]在所述装置的其中一个实施例中,所述装置还包括:代表词典生成模块,用于统计多个功能类别的应用程序接口的功能描述文本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用程序接口确定方法,其特征在于,所述方法包括:获取多个待处理文本数据,所述待处理文本数据为应用程序接口的功能描述文本;利用关键词提取算法确定每个所述待处理文本数据中的摘要;利用预先训练完成的词向量模型对每个所述待处理文本数据的摘要进行处理,得到每个待处理文本数据中所述摘要的嵌入值;根据每个待处理文本数据中所述摘要的嵌入值,确定目标应用程序接口。2.根据权利要求1所述的方法,其特征在于,所述利用关键词提取算法确定每个所述待处理文本数据中的摘要,包括:将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值;根据每个所述文本句的权重值,确定每个所述待处理文本数据的摘要。3.根据权利要求2所述的方法,其特征在于,所述将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值,包括:响应于所述文本句中未存在代表词典中的代表词语,利用关键词提取算法计算每个所述文本句的第一权重值,其中,所述代表词典为与所述待处理文本对应的应用程序接口的功能类别相同的词典;所述代表词典的生成过程包括:根据多个功能类别对应的文本数据的第一常用词集合、每个功能类别对应的文本数据中第二常用词集合,确定每个功能类别对应的代表词典。4.根据权利要求3所述的方法,其特征在于,所述将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值,还包括:响应于所述文本句中存在代表词典中的代表词语,利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值。5.根据权利要求4所述的方法,其特征在于,所述利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值,包括:计算所述代表词语在所述文本句中的代表权重值;将所述代表权重值与所述第一权重进行相加,确定所述文本句的第二权重值。6.根据权利要求3所述的方法,其特征在于,所述代表词典的生成过程进一步包括:统计多个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定多个功能类别对应的文本数据中第一常用词集合;统计每个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定每个功能类别对应的文本数据中第二常用词集合;在所述第二常用词集合中删除与所述第一常用词集合中的相同的词语,得到每个功能类别对应的代表词典。7.根据权利要求6所述的方法,其特征在于,所述统计多个功能类别对应的文本数据中的词语和每个词语对应的词频,确定多个功能类别对应的文本数据中第一常用词集合之前,所述方法还包括:删除多个功能类别的应用程序接口的功能描述文本中的停用词,其中,所述停用词包括:没有实际意义的词语。8.根据权利要求3所述的方法,其特征在于,所述利用关键词提取算法计算每个所述文
本句的第一权重值,包括:分别计算每个所述文本句之间的权重值;响应于所述权重值大于预设的权重阈值,确定所述权重值对应的文本句之间的边;根据每个所述文本句之间的权重值和所述文本句之间的边,确定每个所述文本句的第一权重值。9.一种应用程序接口确定装置,其特征在于,所述装置包括:数据获取模块,用于获取多个待处理文本数据,所述待处理文本数据为应用程序接口的功能描述文本;摘要提取模块,...

【专利技术属性】
技术研发人员:何文慧李尚真江魁栋黄小龙欧阳解文
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1