一种自动化智能活动图生成方法技术

技术编号:38331260 阅读:16 留言:0更新日期:2023-07-29 09:14
本发明专利技术公开一种自动化智能活动图生成方法,包括:步骤1,利用语法规则以及神经网络技术对预先获取的需求文本进行规范化,获得规范化后的需求文本;步骤2,使用预先训练获得的AT

【技术实现步骤摘要】
一种自动化智能活动图生成方法


[0001]本专利技术涉及一种自动化智能活动图生成方法,属于自然语言处理


技术介绍

[0002]从自然语言需求生成统一建模语言(UML)图表的过程,被认为是一项复杂且具有挑战性的任务。自然语言需求通常是相对模糊的,这可能会导致多种解释以及理解需求的困难。在软件开发中,软件需求规范是用自然语言编写的。然而,对软件需求的分析过程是一项关键任务,需要花费大量时间和精力。因此,必须使用自然语言处理技术作为分析和处理自然语言需求的辅助手段。
[0003]目前在活动图自动生成领域较为先进的方法是,先使用基于规则的方法对文本进行规范化,然后使用现有的工具如斯坦福解析器对文本进行处理,再应用规则识别活动图元素最后生成活动图。然而上述方法未考虑对文本进行同义词的替换,同时未考虑软件需求领域数据集少,而导致训练的相关模型过拟合的问题。
[0004]1、《Constructing Activity Diagrams from Arabic User Requirements using Natural Language Processing Tool》提出了一种利用MADA+TOKAN解析器从阿拉伯语用户需求构建活动图的方法。该论文只对最初的需求文本进行简单的书写限制,然后对需求文本进行分析和处理来生成活动图,这会降低最终活动图生成准确性。
[0005]2、《Static UML Model Generator from Analysis of Requirements(SUGAR)》提出了一个名为“来自需求分析的静态UML模型生成器”(SUGAR)的工具,它通过自然语言需求来生成用例模型和类模型。该论文虽然对最初的需求文本进行文本规范化处理,但是该论文并没有考虑到对同义词的替换,会在一定程度上降低活动图生成的准确性。
[0006]3、《Generating UML Use Case and Activity Diagrams Using NLP Techniques and Heuristics Rules》提出了一种基于NLP技术和启发式规则的方法,从非正式的需求文本中生成用例图和活动图。该论文使用Stanford CoreNLP工具分析和处理需求文本,然而该工具包的模型使用公共数据集进行训练,直接拿来做软件需求领域的某些文本处理工作会导致准确性较低。

技术实现思路

[0007]本专利技术所要解决的技术问题是克服现有技术的缺陷,提供一种自动化智能活动图生成方法,涉及自然语言处理、深度学习、神经网络和活动图生成等技术,特别是一种结合规则以及GASR模型的文本规范化方法,解决了基于规则的方法不能考虑文本上下文之间的关系,在做同义词替换时可能会导致替换错误的问题。本专利技术对于提高活动图生成的准确性有着重要意义。
[0008]为达到上述目的,本专利技术提供一种自动化智能活动图生成方法,包括:
[0009]步骤1,利用语法规则以及神经网络技术对预先获取的需求文本进行规范化,获得规范化后的需求文本;
[0010]步骤2,使用预先训练获得的AT

SRnn模型以及依存句法分析的方法对规范化后的需求文本进行处理,获得活动对象以及需求文本词语之间的依存关系;
[0011]步骤3,利用需求文本词语之间的依存关系和活动图元素识别规则,从需求文本中提取UML元素;
[0012]步骤4,利用UML元素和活动对象,生成活动图。
[0013]优先地,步骤1,利用语法规则以及神经网络技术对预先获取的需求文本进行规范化,获得规范化后的需求文本,通过以下步骤实现:
[0014]步骤1.1,利用语法规则修改预先获取的需求文本,获得修改后的需求文本;
[0015]步骤1.2,利用神经网络技术对修改后的需求文本进行同义词替换,获得规范化后的需求文本。
[0016]优先地,步骤1.1,利用语法规则修改预先获取的需求文本,获得修改后的需求文本,通过以下步骤实现:
[0017]删除预先获取的需求文本中没有动词的句子;
[0018]删除预先获取的需求文本的句子中的修饰词语以及结构助词;
[0019]将预先获取的需求文本中的对象代词使用对象名称进行替换;
[0020]将预先获取的需求文本中的被动句转换为主动句;
[0021]将预先获取的需求文本中的“、”视为“和”,将“;”视作“。”,将“:”用“是”替换;
[0022]将预先获取的需求文本中表示并列关系的连词连接的句子进行拆分,获得多个句子,若一个句子只有一个主语和两个及以上动宾短语,则将该句子拆分成多个句子,获得修改后的需求文本。
[0023]优先地,利用神经网络技术对修改后的需求文本进行同义词替换,获得规范化后的需求文本,通过以下步骤实现:
[0024]通过规则库识别修改后的需求文本中所有需要同义替换的词语,得到包含需要同义替换词的文本序列;
[0025]获取所有需要同义替换的词语在修改后的需求文本中的起止位置;
[0026]将包含需要同义替换词的文本序列输入GASR模型进行同义词替换,获得规范化后的需求文本。
[0027]优先地,GASR模型包括嵌入层、双向门循环单元BGRU、门控循环单元GRU、本地多头注意机制模块、线性块和分类器Softmax;
[0028]在编码器端,嵌入层采用词嵌入的方法从文本序列中提取获得文本序列的基本特征;
[0029]双向门循环单元BGRU从包含需要同义替换词的文本序列中提取获得文本序列的上下文相关特征;
[0030]在解码器端,嵌入层采用词嵌入的方法提取文本序列的基本特征,获得第一特征;
[0031]门控循环单元GRU从第一特征中提取获得第二特征;
[0032]将文本序列的上下文相关特征和第二特征发送到本地多头注意机制模块计算局部注意特征,获得第三特征;
[0033]利用线性块将第三特征与文本序列的上下文相关特征进行特征融合,获得融合特征结果;将融合特征结果输入分类器Softmax,分类器输出归一化后的词语;
[0034]根据所有需要同义替换的词语在修改后的需求文本中的起止位置,将归一化后的词语插入修改后的需求文本中对应位置,获得规范化后的需求文本。
[0035]优先地,步骤2,使用预先训练获得的AT

SRnn模型以及依存句法分析的方法对规范化后的需求文本进行处理,获得活动对象以及需求文本词语之间的依存关系,通过以下步骤实现:步骤2.1,首先对规范化后的需求文本进行分割,获得多个完整句子;
[0036]步骤2.2,以字词为单位将需求文本中的完整句子分解;
[0037]步骤2.3,对完整句子中的字词添加相应的标签,获得词性标记后的需求文本;
[0038]步骤2.4,将词性标记后的需求文本输入预先训练获得的AT

SRnn模型,提取获得活动对象;步骤2.5,使用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动化智能活动图生成方法,其特征在于,包括:步骤1,利用语法规则以及神经网络技术对预先获取的需求文本进行规范化,获得规范化后的需求文本;步骤2,使用预先训练获得的AT

SRnn模型以及依存句法分析的方法对规范化后的需求文本进行处理,获得活动对象以及需求文本词语之间的依存关系;步骤3,利用需求文本词语之间的依存关系和活动图元素识别规则,从需求文本中提取UML元素;步骤4,利用UML元素和活动对象,生成活动图。2.根据权利要求1所述的一种自动化智能活动图生成方法,其特征在于,步骤1,利用语法规则以及神经网络技术对预先获取的需求文本进行规范化,获得规范化后的需求文本,通过以下步骤实现:步骤1.1,利用语法规则修改预先获取的需求文本,获得修改后的需求文本;步骤1.2,利用神经网络技术对修改后的需求文本进行同义词替换,获得规范化后的需求文本。3.根据权利要求2所述的一种自动化智能活动图生成方法,其特征在于,步骤1.1,利用语法规则修改预先获取的需求文本,获得修改后的需求文本,通过以下步骤实现:删除预先获取的需求文本中没有动词的句子;删除预先获取的需求文本的句子中的修饰词语以及结构助词;将预先获取的需求文本中的对象代词使用对象名称进行替换;将预先获取的需求文本中的被动句转换为主动句;将预先获取的需求文本中的“、”视为“和”,将“;”视作句号,将“:”用“是”替换;将预先获取的需求文本中表示并列关系的连词连接的句子进行拆分,获得多个句子,若一个句子只有一个主语和两个及以上动宾短语,则将该句子拆分成多个句子,获得修改后的需求文本。4.根据权利要求2所述的一种自动化智能活动图生成方法,其特征在于,利用神经网络技术对修改后的需求文本进行同义词替换,获得规范化后的需求文本,通过以下步骤实现:通过规则库识别修改后的需求文本中所有需要同义替换的词语,得到包含需要同义替换词的文本序列;获取所有需要同义替换的词语在修改后的需求文本中的起止位置;将包含需要同义替换词的文本序列输入GASR模型进行同义词替换,获得规范化后的需求文本。5.根据权利要求4所述的一种自动化智能活动图生成方法,其特征在于,GASR模型包括嵌入层、双向门循环单元BGRU、门控循环单元GRU、本地多头注意机制模块、线性块和分类器Softmax;在编码器端,嵌入层采用词嵌入的方法从文本序列中提取获得文本序列的基本特征;双向门循环单元BGRU从包含需要同义替换词的文本序列中提取获得文本序列的上下文相关特征;
在解码器端,嵌入层采用词嵌入的方法提取文本序列的基本特征,获得第一特征;门控循环单元GRU从第一特征中提取获得第二特征;将文本序列的上下文相关特征和第二特征发送到本地多头注意机制模块计算局部注意特征,获得第三特征;利用线性块将第三特征与文本序列的上下文相关特征进行特征融合,获得融合特征结果;将融合特征结果输入分类器Softmax,分类器输出归一化后的词语;根据所有需要同义替换的词语在修改后的需求文本中的起止位置,将归一化后的词语插入修改后的需求文本中对应位置,获得规范化后的需求文本。6.根据权利要求1所述的一种自动化智能活动图生成方法,其特征在于,步骤2,使用预先训练获得的AT

SRnn模型以及依存句法分析的方法对规范化后的需求文本进行处理,获得活动对象以及需求文本词语之间的依存关系,通过以下步骤实现:步骤2.1,首先对规范化后的需求文本进行分割,获得多个完整句子;步骤2.2,以字词为单位将需求文本中的完整句子分解;步骤2.3,对完整句子中的字词添加相应的标签,获得词性标记后的需求文...

【专利技术属性】
技术研发人员:许斌俞文军崔秋兰殷史弘亓晋孙雁飞
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1