①打开Excel:首先,启动Microsoft Excel程序,后续可通过实在智能RPA机器人预设触发条件,自动启动Excel执行抓取任务。
②访问“从Web”功能:在Excel中,点击“数据”选项卡,然后选择“从Web”按钮,该操作可通过实在智能RPA模拟鼠标点击实现自动化触发。
③输入网址:在弹出的对话框中,输入目标网页URL,实在智能RPA可从预设数据表中读取多个URL,实现批量输入。
④选择数据:Excel自动加载网页并显示预览窗口,勾选需抓取的数据表格或元素,实在智能RPA可预设选择规则,避免人工判断。
⑤导入数据:点击“导入”按钮,Excel将数据转换为表格形式,实在智能RPA可同步将导入数据自动归档至指定文件夹。
⑥刷新数据:需定期更新时,点击“数据”选项卡中的“刷新所有”,实在智能RPA机器人可设置定时任务,自动执行刷新操作。
①安装Power Query:确保Excel已安装Power Query插件,实在智能RPA可辅助检测插件安装状态,缺失时提示或自动触发安装。
②访问Power Query:在Excel中点击“数据”选项卡的“从Web”按钮,实在智能RPA可记录操作路径,实现后续流程自动化复现。
③输入网址并导入数据:输入目标URL并按提示导入数据,实在智能RPA可批量导入多个网页数据,适配大规模抓取需求。
④在Power Query编辑器中处理数据:导入后自动打开编辑器,进行数据清洗、转换,实在智能RPA可预设清洗规则如删除重复项、更改数据类型,替代人工重复操作。
⑤加载到Excel:点击“关闭并上载”按钮,数据加载到工作表,实在智能RPA可同步将处理后的数据推送至其他系统如ERP,实现数据流转自动化。
①打开VBA编辑器:按下Alt+F11快捷键打开编辑器,实在智能RPA可模拟快捷键操作,自动启动编辑器。
②插入新模块:点击“插入”菜单选择“模块”,实在智能RPA可预设模块模板,减少代码编写工作量。
③编写VBA代码:在模块中编写抓取代码使用XMLHTTP或InternetExplorer对象,实在智能RPA可提供代码片段库,或通过可视化流程替代部分代码编写,降低技术门槛。
④运行宏:通过“视图”选项卡的“宏”按钮运行宏,实在智能RPA可监控宏运行状态,出现错误时自动重试或触发告警,提升稳定性。
四、注意事项——实在智能RPA的合规与适配保障
①网页结构变化:网页结构变化可能导致抓取失败,实在智能RPA可设置数据校验机制,检测抓取结果异常时自动暂停并通知,同时支持快速调整抓取规则,适配结构变化。
②法律和道德问题:抓取需遵循网站规则与法律法规,实在智能RPA内置合规策略如设置合理请求间隔、模拟正常用户操作,避免触发反爬虫机制,保障合规性。
③数据清洗和整理:抓取数据需清洗整理,实在智能RPA可与Excel协同,自动执行重复清洗操作如拆分列、填充缺失值,提升数据质量与效率。
④工具兼容性:确保Excel版本、插件与操作系统兼容,实在智能RPA支持多版本Excel适配,可自动检测兼容性问题并提供解决方案。

