计算机操作辅助方法、系统、电子设备及存储介质技术方案

技术编号：33772501 阅读：12 留言：0更新日期：2022-06-12 14:25

本申请公开了一种计算机操作辅助方法、系统、电子设备及存储介质，该方法包括：采集计算机的当前屏幕显示信息，对当前屏幕显示信息进行处理，得到多个关键帧图像；将多个关键帧图像输入预先构建的操作辅助模型进行识别，得到当前屏幕显示信息对应的目标辅助动作；控制计算机执行目标辅助动作，以辅助计算机操作。本申请的实施例可以根据用户的习惯，自动的学习，模仿用户的习惯做出决策，并且可以在无人工干预的情况下自动化的操作。由此，解决了目前计算机操作辅助应用范围小、功能死板、操作复杂等问题。复杂等问题。复杂等问题。

全部详细技术资料下载

【技术实现步骤摘要】
计算机操作辅助方法、系统、电子设备及存储介质

[0001]本申请涉及人工智能
，特别涉及一种计算机操作辅助方法、系统、电子设备及存储介质。

技术介绍

[0002]随着科技的进步，越来越多的技术已经被人们认可，并被用于各行各业中，其中对于一些重复的、枯燥的、消耗大量人工劳动的任务也逐渐被一些自动化软件代替。例如，某一任务要求每天打卡签到，具体为：早上8点需要打开办公软件，找到打卡的功能，进入打卡的界面，然后点击打卡按钮完成打卡，最后退出该办公软件，在下午17点时需要再次打开办公软件，完成和早上一样的操作。这显然是一个重复且枯燥的任务，一些自动化操作助手，也可以完成该任务，例如，按键精灵，它可以模拟鼠标和键盘的动作，通过制作脚本完成一些信息发布、报表提交、邮件整理等任务，但是这些操作是死板的、不灵活的，并且需要人工提前编写程序，也就是需要制作这些任务的脚本来完成该任务，这也是目前已有的自动化操作助手的弊端。如果可以设计一款在使用时无需人工编写程序、全自动化的操作助手，那可以节省更多的人力物力，带来更大的社会收益。
[0003]在现有的自动化操作助手中，由于执行的操作都是基于模型的，也就是将需要处理的任务提前通过编写程序制作为脚本，但由于这些模型是提前写好的、不可变的，不能灵活的使用，对于实际应用中必须做到和模型一模一样才能匹配成功，这限制了该模型的使用场景，只能等待用户需要执行任务时，才会触发该脚本，这对于使用者及其不便，对于使用者要有更高的要求，需要自学一套符合该操作助手的编程范式，并且该操作助手对于数据...

【技术保护点】

【技术特征摘要】
1.一种计算机操作辅助方法，其特征在于，包括以下步骤：采集计算机的当前屏幕显示信息，对所述当前屏幕显示信息进行处理，得到多个关键帧图像；将所述多个关键帧图像输入预先构建的操作辅助模型进行识别，得到所述当前屏幕显示信息对应的目标辅助动作；控制所述计算机执行所述目标辅助动作，以辅助计算机操作。2.根据权利要求1所述的方法，其特征在于，所述对所述当前屏幕显示信息进行处理，得到多个关键帧图像，包括：由所述当前屏幕显示信息获取所述计算机的视频数据，以将所述视频数据作为所述当前屏幕显示信息，通过数据转换得到当前屏幕的多张图像数据，或采集当前屏幕的多张图像数据；根据预设提取规则从所述多张图像数据中提取所述多个关键帧图像。3.根据权利要求1或2所述的方法，其特征在于，所述将所述多个关键帧图像输入预先构建的操作辅助模型进行识别，得到所述当前屏幕显示信息对应的目标辅助动作，包括：将所述多个关键帧图像输入所述预先构建的操作辅助模型进行识别，对多个识别结果进行取平均或加权后得到所述多个关键帧图像对应的目标辅助动作。4.根据权利要求1所述的方法，其特征在于，所述采集计算机的当前屏幕显示信息之前，还包括：采集计算机的输出信息以及对应的用户的输入信息组成输入
‑
输出数据组；对所述输入
‑
输出数据组进行数据标注，利用标注后的输入
‑
输出数据组进行模型训练，得到所述操作辅助模型。5.根据权利要求1所述的方法，其特征在于，所述输入
‑
输出数据组包括计算机的屏幕显示信息和用户鼠标或键盘输入信息。6.一种计算机操作辅助系统，其特征在于，包括：处理模块，用于采集计算机的当前屏幕显示信息，对所述当前屏幕显示信息进行处理，得到多个关键帧图像；识别模块，用于将所述多个关键帧图像输...

【专利技术属性】
技术研发人员：张清天，郝晓龙，吴华强，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人