【技术实现步骤摘要】
一种基于JAVADoc知识图谱的多维评估推荐方法
本专利技术涉及数据库推荐
,特别是涉及一种基于JavaDoc知识图谱的多维评估推荐方法。
技术介绍
目前,公开了一种API推荐得方法,包括建立知识库、问题和回答模式抽取、查询语句解释、文档搜索、答案排序五个步骤、该方法可以实现根据相关问题推荐相似API的效果,但该方法的准确度较低。该方法存在的问题是在推荐相似API的时候只考虑到了API文档描述上的相似,而没有充分利用API在其本身组织结构上的内在联系。
技术实现思路
本专利技术提供一种基于JavaDoc知识图谱的多维评估推荐方法,通过建立知识图谱来构建API之间的联系,再通过相似内置类推荐算法生成推荐域,减少了推荐的数据量,来提高API推荐时的准确率和响应速度。本专利技术采用的技术方案如下:建立JavaDoc的知识图谱,用Python中的BeautifulSoup工具包来爬取数据,之后对爬取的数据进行筛选,知识扩充,知识纠错,得到一个数据集;通过对数据的分析以及遍历进行类模型的建立,接口模型 ...
【技术保护点】
1.一种基于JAVA Doc知识图谱的多维评估推荐方法,其特征在于,所述方法包括:/n通过对Java Doc文档的爬取以及分析建立一个Java类知识图谱,所述Java Doc是HTML格式的静态网页文件;/n根据所述建立好的Java Doc知识图谱,通过类与外界的关系分析实体间的路径关系,建立推荐函数对数据进行挖掘,通过类和类之间的关系确定类推荐域;/n对类之间进行聚类,将聚类结果作为所述推荐域的补集;/n对所述推荐域的候选项进行量化评分,根据所述评分建立综合量化评分模型。/n
【技术特征摘要】
1.一种基于JAVADoc知识图谱的多维评估推荐方法,其特征在于,所述方法包括:
通过对JavaDoc文档的爬取以及分析建立一个Java类知识图谱,所述JavaDoc是HTML格式的静态网页文件;
根据所述建立好的JavaDoc知识图谱,通过类与外界的关系分析实体间的路径关系,建立推荐函数对数据进行挖掘,通过类和类之间的关系确定类推荐域;
对类之间进行聚类,将聚类结果作为所述推荐域的补集;
对所述推荐域的候选项进行量化评分,根据所述评分建立综合量化评分模型。
2.如权利要求1所述的基于JAVADoc知识图谱的多维评估推荐方法,其特征在于,所述知识图谱的建立包括:
数据的抽取:JavaDoc文档的爬取采用Python中的BeautifulSoup工具包来获取内容信息;
数据规范化:对获取的原始数据中存在的大量杂质及噪音进行过滤处理,知识纠错;
建立RDF模型:分析数据建立数据的RDF模型,包括类模型的建立,接口模型的建立以及整体RDF结构模型的建立;
数据可视化:将数据以RDF的形式存入数据库系统中。
3.如权利要求2所述的基于JAVADoc知识图谱的多维评估推荐方法,其特征在于,所述内容信息包括:类所包含的所有方法,方法的描述,声明,参数,返回值,抛出异常等所有包含在HTML中的数据,类名以及类和外部间的关系,类内部的方法及其属性。
4.如权利要求2所述的基于JAVADoc知识图谱的多维评估推荐方法,其特征在于,所述杂质包括:
类的声明中所包含实现接口和继承父类以及拥有子类的信息存在重复出现的情况;
由于HTML文件中标签的重复出现,导致在获取某一特定位置的内容会出现定位错误或者多次定位的情况;
由于有些函数不存在参数或者异常,但有些函数却存在多个参数和异常,在HTML中每一个参数和异常都以标签的形式不定次数,不定位置的出现;
所述知识纠错是通过正则表达式对类名称书写不一致的问题进行纠正。
5....
【专利技术属性】
技术研发人员:康雁,李浩,钟声,李涛,杨兵,陈铁,张亚钏,卜荣景,
申请(专利权)人:云南大学,
类型:发明
国别省市:云南;53
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。