一种基于词向量的多平台控件对应方法技术

技术编号：15639277 阅读：74 留言：0更新日期：2017-06-15 22:31

本发明专利技术公开了一种基于词向量的多平台控件对应方法，包括如下步骤：寻找与控件、UI设计、页面布局文件相关的英文文档组成词向量的训练集；使用stanford工具对英文文档进行分词得到单词序列；对得到的单词序列使用word2vec进行词向量训练，得到每个单词的向量表示；找到平台网站上的控件描述文本；将这些描述文本分词之后训练得到词向量，进而转化为句向量；计算每两个向量之间的距离，选出相似控件。本发明专利技术根据官方的空间描述找到的多平台控件对应关系可以减少同一平台上版本更替所需要修改的代码，并且会在跨平台代码转化中的UI部分起到相当大的推荐作用。还有，本发明专利技术的思路会对其他的工程设计尤其是API对应有着借鉴意义。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于词向量的多平台控件对应方法
本专利技术涉及计算机编程领域中的多平台代码转化，具体涉及一种基于词向量的多平台控件对应方法。
技术介绍
随着移动平台版本演化越来越快，平台App工程开发周期不断增加，移动跨平台开发的课题重新归回人们的视野。最新的ReactNative软件似乎再次让我们看到了工程完美转化的希望，不过UI始终是困扰研究学者的一个难题，平台的设计的差异始终难以解决。一般来讲，用法和语言上的差异我们都可以使用底层的接口来解决。所以本文就撇开UI控件的用法，单单寻找控件的对应关系。也许，从工程方法的角度思考更容易让我们理解控件、寻找控件的特点，对文档的挖掘才是找到对应关系的一剂良方。因此本文使用词向量、句向量与欧氏距离这个目前最适合短文本处理的思路对平台的控件描述文本进行计算，尽量保持了文本在句法理解控件上的信息，减少人工干预的程度，得到控件的对应关系。
技术实现思路
专利技术目的：本专利技术所要解决的问题是提供一种自动化的多平台多版本控件对应方法。技术方案：一种基于词向量的多平台控件对应方法，包括如下步骤：步骤1：寻找与控件、UI设计、页面布局文件相关的英文文档组成词向量的训练集；步骤2：使用stanford工具对步骤1所得的英文文档进行分词得到单词序列；步骤3：对步骤2所得到的单词序列使用word2vec进行词向量训练，得到每个单词的向量表示；步骤4：找到平台网站上的控件描述文本；步骤5：将步骤4得到的控件描述文本使用stanford工具分词之后得到每个控件的单词序列；在步骤3中的向量表示中找到每个单词获取这个单词的词向量，对一个句子中的所有词向...
一种基于词向量的多平台控件对应方法

【技术保护点】
一种基于词向量的多平台控件对应方法，其特征在于：包括如下步骤：步骤1：寻找与控件、UI设计、页面布局文件相关的英文文档组成词向量的训练集；步骤2：使用stanford工具对步骤1所得的英文文档进行分词得到单词序列；步骤3：对步骤2所得到的单词序列使用word2vec进行词向量训练，得到每个单词的向量表示；步骤4：找到平台网站上的控件描述文本；步骤5：将步骤4得到的控件描述文本使用stanford工具分词之后得到每个控件的单词序列；在步骤3中的向量表示中找到每个单词获取这个单词的词向量，对一个句子中的所有词向量求均值得到句向量；步骤6：对于每一个控件，计算其句向量与另一个平台上所有控件句向量的距离，并对计算得到的距离进行排序，得到该控件的最相似控件。

【技术特征摘要】
1.一种基于词向量的多平台控件对应方法，其特征在于：包括如下步骤：步骤1：寻找与控件、UI设计、页面布局文件相关的英文文档组成词向量的训练集；步骤2：使用stanford工具对步骤1所得的英文文档进行分词得到单词序列；步骤3：对步骤2所得到的单词序列使用word2vec进行词向量训练，得到每个单词的向量表示；步骤4：找到平台网站上的控件描述文本；步骤5：将步骤4得到的控件描述文本使用stanford工具分词之后得到每个控件的单词序列；在步骤3中的向量表示中找到每个单词获取这个单词的词向量，对一个句子中的所有词向量求均值得到句向量；步骤6：对于每一个控件，计算其句向量与另一个平台上所有控件句向量的距离，并对计算得到的距离进行排序，得到该控件的最相似控件。2.根据权利要求1所述的多平台控件对应方法，其特征在于：所述步骤1中英文文档的来源包括(1)平台官网上的所有介绍；(2)各大网站上的定义；(3)从各种渠道搜索得到的对某个控件的整理资料；(4)在国外网站上搜索博客或者论坛，获取与控件相关的网页的...

【专利技术属性】
技术研发人员：张天，潘敏学，裴俊宇，李宣东，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人