【技术实现步骤摘要】
特征的生成方法、装置、电子设备和存储介质
本申请涉及计算机
,尤其涉及机器学习领域中的特征的生成方法、装置、电子设备和存储介质。
技术介绍
在机器学习领域中,训练神经网络模型时,特征的生成是必经的过程。其中,特征为根据训练数据集生成的,用于表征训练数据集的属性。特征的生成较为复杂,且每个特征的生成逻辑也千差万别,因此如何快速准确地生成特征至关重要。现有技术中,程序人员需要预先写好神经网络模型中生成所有的特征的逻辑。这样,在向神经网络模型中输入训练数据集后,可以采用特征的逻辑生成特征。但现有技术的方法中生成特征的逻辑是程序人员采用代码的方式表征的。如果需要调整一个特征,则需要程序人员修改代码,过程不灵活,且技术要求较高。
技术实现思路
本申请提供一种特征的生成方法、装置、电子设备和存储介质,调整特征可以通过调整输入的标签的描述文本实现,提高了特征生成的灵活性,降低了技术要求。本申请第一方面提供一种特征的生成方法,包括:接收用户输入的标签文本集,所述标签文本集中包括至少一 ...
【技术保护点】
1.一种特征的生成方法,其特征在于,包括:/n接收用户输入的标签文本集,所述标签文本集中包括至少一个标签的描述文本;/n根据每个所述标签的描述文本,生成每个所述标签的描述文本对应的特征的逻辑文本;/n运行每个所述特征的逻辑文本,生成每个所述标签的描述文本对应的特征,以获取特征集。/n
【技术特征摘要】
1.一种特征的生成方法,其特征在于,包括:
接收用户输入的标签文本集,所述标签文本集中包括至少一个标签的描述文本;
根据每个所述标签的描述文本,生成每个所述标签的描述文本对应的特征的逻辑文本;
运行每个所述特征的逻辑文本,生成每个所述标签的描述文本对应的特征,以获取特征集。
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述标签的描述文本,生成每个所述标签的描述文本对应的特征的逻辑文本,包括:
将每个所述标签的描述文本进行分词,获取每个所述标签的描述文本的至少一个目标词语;
根据每个所述标签的描述文本的至少一个目标词语,获取每个所述标签的描述文本的有向无环图,每个所述标签的描述文本的有向无环图包括至少一个节点,每个节点对应该标签的描述文本的一个目标词语,每个所述标签的描述文本的有向无环图用于表征至少一个目标词语之间的关联关系;
根据每个所述标签的描述文本的有向无环图,生成每个所述标签的描述文本对应的特征的逻辑文本。
3.根据权利要求2所述的方法,其特征在于,所述根据每个所述标签的描述文本的至少一个目标词语,获取每个所述标签的描述文本的有向无环图,包括:
将每个所述标签的描述文本的每个目标词语与元数据进行映射,以获取每个所述标签的描述文本的每个目标词语的属性和每个目标词语的优先级,所述元数据中包括至少一个属性、属性的优先级,以及属性中每个词语的优先级;
根据每个所述标签的描述文本的每个目标词语的属性和每个目标词语的优先级,获取每个所述标签的描述文本的第一有向无环图,所述第一有向无环图为所述有向无环图。
4.根据权利要求3所述的方法,其特征在于,所述将每个所述标签的描述文本的每个目标词语与元数据进行映射,以获取每个所述标签的描述文本的每个目标词语的属性和每个目标词语的优先级,包括:
将所述元数据的属性中与目标词语相同的词语的属性作为目标词语的属性,且将与目标词语相同的词语的优先级作为目标词语的优先级,所述目标词语的优先级包括目标词语的属性的优先级,以及目标词语在所属的属性中的词语的优先级。
5.根据权利要求3所述的方法,其特征在于,每个所述标签的描述文本的有向无环图还包括至少一个第二有向无环图,所述方法还包括:
根据每个所述标签的描...
【专利技术属性】
技术研发人员:王志清,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。