应用程序包检测方法、设备、存储介质及装置制造方法及图纸

技术编号:36681954 阅读:16 留言:0更新日期:2023-02-27 19:40
本发明专利技术涉及互联网技术领域,公开了一种应用程序包检测方法、设备、存储介质及装置,该方法包括:获取待检测应用程序包,并从待检测应用程序包中提取待检测文本,对待检测文本进行格式检测,获得格式检测结果,通过预设语义检测模型对待检测文本进行语义检测,获得语义检测结果,根据格式检测结果和语义检测结果生成待检测应用程序包的合规检测结果;由于本发明专利技术对应用程序包的文本进行格式检测和语义检测,并根据格式检测结果和语义检测结果生成应用程序包的合规检测结果,从而能够自动检测应用程序包是否合规,提高合规检测的速度和准确率。率。率。

【技术实现步骤摘要】
应用程序包检测方法、设备、存储介质及装置


[0001]本专利技术涉及互联网
,尤其涉及一种应用程序包检测方法、设备、存储介质及装置。

技术介绍

[0002]目前,应用程序包在上传到应用商店时,审核人员会人工检查应用程序包是否合规。现有的人工检查应用程序包是否合规的方式,由于应用程序包中的文本内容较多,人工检测费时费力,从而存在检查速度慢、准确率低的缺陷。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种应用程序包检测方法、设备、存储介质及装置,旨在解决现有技术中人工检查应用程序包是否合规时,由于应用程序包中的文本内容较多,人工检测费时费力,从而存在检查速度慢、准确率低的技术问题。
[0005]为实现上述目的,本专利技术提供一种应用程序包检测方法,所述应用程序包检测方法包括以下步骤:
[0006]获取待检测应用程序包,并从所述待检测应用程序包中提取待检测文本;
[0007]对所述待检测文本进行格式检测,获得格式检测结果;
[0008]通过预设语义检测模型对所述待检测文本进行语义检测,获得语义检测结果;
[0009]根据所述格式检测结果和所述语义检测结果生成所述待检测应用程序包的合规检测结果。
[0010]可选地,所述对所述待检测文本进行格式检测,获得格式检测结果的步骤,包括:
[0011]获取所述待检测文本的文本字符数,并根据所述文本字符数生成长度检测结果;
[0012]对所述待检测文本进行拼写规范检测,获得拼写规范检测结果;
[0013]从所述待检测文本中提取文本关键词,并对所述文本关键词进行检测,获得关键词检测结果;
[0014]根据所述长度检测结果、所述拼写规范检测结果以及所述关键词检测结果确定格式检测结果。
[0015]可选地,所述获取所述待检测文本的文本字符数,并根据所述文本字符数生成长度检测结果的步骤,包括:
[0016]从所述待检测文本中提取标题文本,并获取所述标题文本的文本字符数;
[0017]判断所述文本字符数是否大于预设字符数阈值,并根据判断结果生成长度检测结果。
[0018]可选地,所述从所述待检测文本中提取文本关键词,并对所述文本关键词进行检测,获得关键词检测结果的步骤,包括:
[0019]从所述待检测文本中提取文本关键词,并对所述文本关键词进行分类,获得关键词类别;
[0020]将所述关键词类别与预设违规类别进行匹配,并根据匹配结果生成关键词检测结果。
[0021]可选地,所述将所述关键词类别与预设违规类别进行匹配,并根据匹配结果生成关键词检测结果的步骤,包括:
[0022]获取所述待检测应用程序包对应的审核平台,并查找所述审核平台对应的目标违规类别;
[0023]将所述关键词类别与所述目标违规类别进行匹配,并根据匹配结果生成关键词检测结果。
[0024]可选地,所述对所述待检测文本进行拼写规范检测,获得拼写规范检测结果的步骤,包括:
[0025]从所述待检测文本中提取文字分隔符和待检测词语;
[0026]检测所述文字分隔符是否使用错误,获得分隔符检测结果;
[0027]检测所述待检测词语是否拼写错误,获得拼写检测结果;
[0028]根据所述分隔符检测结果和所述拼写检测结果确定拼写规范检测结果。
[0029]可选地,所述通过预设语义检测模型对所述待检测文本进行语义检测,获得语义检测结果的步骤,包括:
[0030]通过预设语义检测模型对所述待检测文本进行语义检测,获得所述待检测文本与预设违规文本的文本相似度;
[0031]根据所述文本相似度生成语义检测结果。
[0032]可选地,所述根据所述文本相似度生成语义检测结果的步骤,包括:
[0033]判断所述文本相似度是否大于预设相似度阈值;
[0034]若是,则将所述文本相似度对应的预设违规文本作为语义检测结果。
[0035]可选地,所述通过预设语义检测模型对所述待检测文本进行语义检测,获得语义检测结果的步骤之前,还包括:
[0036]获取多个类别的文本样本;
[0037]根据所述文本样本对初始语义检测模型进行训练,获得预设语义检测模型。
[0038]可选地,所述根据所述文本样本对初始语义检测模型进行训练,获得预设语义检测模型的步骤,包括:
[0039]将所述文本样本输入初始语义检测模型,获得输出结果;
[0040]根据所述输出结果调整所述初始语义检测模型的模型参数,获得预设语义检测模型。
[0041]可选地,所述根据所述格式检测结果和所述语义检测结果生成所述待检测应用程序包的合规检测结果的步骤之后,还包括:
[0042]根据所述合规检测结果生成所述待检测应用程序包的合规修改信息;
[0043]展示所述合规检测结果和所述合规修改信息。
[0044]此外,为实现上述目的,本专利技术还提出一种应用程序包检测设备,所述应用程序包检测设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的应用程序
包检测程序,所述应用程序包检测程序配置为实现如上文所述的应用程序包检测方法。
[0045]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有应用程序包检测程序,所述应用程序包检测程序被处理器执行时实现如上文所述的应用程序包检测方法。
[0046]此外,为实现上述目的,本专利技术还提出一种应用程序包检测装置,所述应用程序包检测装置包括:文本获取模块、格式检测模块、语义检测模块以及结果生成模块;
[0047]所述文本获取模块,用于获取待检测应用程序包,并从所述待检测应用程序包中提取待检测文本;
[0048]所述格式检测模块,用于对所述待检测文本进行格式检测,获得格式检测结果;
[0049]所述语义检测模块,用于通过预设语义检测模型对所述待检测文本进行语义检测,获得语义检测结果;
[0050]所述结果生成模块,用于根据所述格式检测结果和所述语义检测结果生成所述待检测应用程序包的合规检测结果。
[0051]可选地,所述格式检测模块,还用于从所述待检测文本中提取标题文本,并获取所述标题文本的文本字符数;
[0052]所述格式检测模块,还用于判断所述文本字符数是否大于预设字符数阈值,并根据判断结果生成长度检测结果。
[0053]可选地,所述格式检测模块,还用于从所述待检测文本中提取文本关键词,并对所述文本关键词进行分类,获得关键词类别;
[0054]所述格式检测模块,还用于将所述关键词类别与预设违规类别进行匹配,并根据匹配结果生成关键词检测结果。
[0055]可选地,所述格式检测模块,还用于获取所述待检测应用程序包对应的审核平台,并查找所述审核平台对应的目标违规类别;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用程序包检测方法,其特征在于,所述应用程序包检测方法包括以下步骤:获取待检测应用程序包,并从所述待检测应用程序包中提取待检测文本;对所述待检测文本进行格式检测,获得格式检测结果;通过预设语义检测模型对所述待检测文本进行语义检测,获得语义检测结果;根据所述格式检测结果和所述语义检测结果生成所述待检测应用程序包的合规检测结果。2.如权利要求1所述的应用程序包检测方法,其特征在于,所述对所述待检测文本进行格式检测,获得格式检测结果的步骤,包括:获取所述待检测文本的文本字符数,并根据所述文本字符数生成长度检测结果;对所述待检测文本进行拼写规范检测,获得拼写规范检测结果;从所述待检测文本中提取文本关键词,并对所述文本关键词进行检测,获得关键词检测结果;根据所述长度检测结果、所述拼写规范检测结果以及所述关键词检测结果确定格式检测结果。3.如权利要求2所述的应用程序包检测方法,其特征在于,所述获取所述待检测文本的文本字符数,并根据所述文本字符数生成长度检测结果的步骤,包括:从所述待检测文本中提取标题文本,并获取所述标题文本的文本字符数;判断所述文本字符数是否大于预设字符数阈值,并根据判断结果生成长度检测结果。4.如权利要求2所述的应用程序包检测方法,其特征在于,所述从所述待检测文本中提取文本关键词,并对所述文本关键词进行检测,获得关键词检测结果的步骤,包括:从所述待检测文本中提取文本关键词,并对所述文本关键词进行分类,获得关键词类别;将所述关键词类别与预设违规类别进行匹配,并根据匹配结果生成关键词检测结果。5.如权利要求4所述的应用程序包检测方法,其特征在于,所述将所述关键词类别与预设违规类别进行匹配,并根据匹配结果生成关键词检测结果的步骤,包括:获取所述待检测应用程序包对应的审核平台,并查找所述审核平台对应的目标违规类别;将所述关键词类别与所述目标违规类别进行匹...

【专利技术属性】
技术研发人员:宋泽坤
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1