一种用于网页导航任务训练的数据集生成方法及装置制造方法及图纸

技术编号:41186148 阅读:20 留言:0更新日期:2024-05-07 22:18
本申请提供了一种用于网页导航任务训练的数据集生成方法、装置、设备及存储介质,涉及人工智能技术领域。该方法包括:先构建网页集,其中网页集中包括在外部网络环境下进行访问的外部网页和通过内部网络进行访问的内部网页,然后基于网页集中的内部网页和外部网页中的信息生成能够代表用户指令的自然语言指令,最后基于所述自然语言指令执行网页导航任务,并记录完成所述网页导航任务时的原子操作轨迹。得到用于网页导航任务训练时的数据集,该数据集中包括网页集、自然语言指令和原子操作轨迹,根据本申请中的中文数据集进行模型训练能够使得模型拥有更强的泛化能力,另外由于自然语言指令的多样性,可模拟真实用户交互场景,优化用户体验。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种用于网页导航任务训练的数据集生成方法、装置、设备及存储介质。


技术介绍

1、网页导航任务是指让web代理(web agent)完成在网页上的导航和操作。典型的任务包括根据给定关键词在搜索引擎上搜索信息、在社交媒体或论坛网站上进行指定的操作、在结果网页中浏览和提取相关信息、按照要求填写并提交在线表格、在网页应用中进行注册、登录等操作、在购物网站上查找商品并加入购物车等。

2、完成这些任务需要web agent能够像人类一样理解网页内容和结构,分析页面元素,并进行模拟鼠标点击、文本输入等交互操作。与此同时,web agent还需要遵循任务要求,只提取相关信息,并保护用户隐私。总的来说,网页导航任务考察了web agent在网页环境中的理解和交互能力,专注于在网页环境中完成自动化操作,是ai实际应用的一个重要方向。它通过分析网页的dom结构,定位页面元素,并进行点击、输入、提交表单等动作。

3、在进行网页导航任务训练时,需要用到数据集,数据集中提供了大量训练样本,可以快速迭代模型,对web agent进行训本文档来自技高网...

【技术保护点】

1.一种用于网页导航任务训练的数据集生成方法,其特征在于,所述数据集包括网页集,自然语言指令和原子操作轨迹,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述构建网页集之后,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述外部网页进行处理包括:

4.根据权利要求1所述的方法,其特征在于,所述构建网页集之后,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述网页集中的网页,构造自然语言指令包括:

6.根据权利要求1所述的方法,其特征在于,所述记录完成网页导航任务时执行的原子操...

【技术特征摘要】

1.一种用于网页导航任务训练的数据集生成方法,其特征在于,所述数据集包括网页集,自然语言指令和原子操作轨迹,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述构建网页集之后,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述外部网页进行处理包括:

4.根据权利要求1所述的方法,其特征在于,所述构建网页集之后,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述网页集中的网页,构造自然语言指令包括:

6.根据权利要求1...

【专利技术属性】
技术研发人员:席春玲
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1