教你使用服务器搭建一款基于智能体的浏览器自动化工具Cerebellum

内容分享2天前发布
0 0 0

你有没有遇到过这些场景:

每天都要重复登录各种后台

要从网页抓数据、导表、截图、下载文件

要模拟人工点击、填表、切换页面

想要用 AI 自动执行浏览器里的任务,却找不到好用的工具

其实,这类“浏览器自动化”在以前属于专业开发者的领域,需要写 Selenium、Playwright、Puppeteer,门槛极高。

但现在出现了 Cerebellum ——一款 基于智能体(AI Agent)驱动的自动化 Web 操控工具,让浏览器真正“像人一样工作”。

你只需要给它一个任务,例如:

“登录后台,导出今天的订单”

“打开某页面,抓取所有商品名称写成 JSON”

“模拟用户行为,自动执行测试流程”

它就能 自动分析网页 → 自动点击按钮 → 输入内容 → 滚动 → 等待 → 下载文件 → 完成任务
整个过程像一个懂事的 AI 助手在替你操作电脑。

今天就带你使用 莱卡云服务器 搭建属于你自己的 Cerebellum 自动化平台。

教你使用服务器搭建一款基于智能体的浏览器自动化工具Cerebellum

一、Cerebellum 是什么?它能做什么?

Cerebellum 是一款专注于 浏览器自动化 + 智能体代理执行任务 的开源工具,特点非常鲜明:

✔ AI 自动理解网页结构

不需要写 XPath、不需要找定位器。

✔ 自动执行实际浏览器中的操作

包括:

点击按钮

输入内容

打开新标签页

滚动页面

上传下载文件

DOM 选择

执行 JS

截图

和人工操作几乎一模一样。

✔ 支持智能体(Agent)反复迭代

AI 会自己判断任务是否完成、不行会自己重试。

✔ 支持 API 调用

你可以把它作为后台服务,接受任务指令。

✔ 可自我扩展

可以接入:

大语言模型

RPA 系统

任务调度器

企业内部工具

这意味着你可以让它成为:
你团队的自动化助手、爬虫助手、测试助手、办公助手。


二、为什么要部署在服务器?

浏览器自动化本身就不适合放在本地:

本地电脑容易断电、睡眠、网络不稳

操作时会占用 Chrome,影响你正常工作

大量任务会卡住电脑

难以做到 24 小时执行

而将 Cerebellum 放在服务器上,有这些优势:

✔ 24 小时不间断执行任务

自动化流程永不中断。

✔ 本地无需运行浏览器

所有操作都在远程 headless 浏览器里完成。

✔ 可多人共享

团队成员都可以发送任务给 Cerebellum。

✔ 替代传统 RPA 工具

更灵活、费用更低、部署更快。

✔ 可与自家业务系统整合

作为“浏览器自动操作 API 服务”使用。

所以放在莱卡云服务器是非常自然的选择。

三、准备一台服务器

推荐配置(按真实使用经验):

2–4 核 CPU(自动化动作较多)

8GB 内存(浏览器占内存)

40GB SSD

系统:Ubuntu 22.04 或 Debian 12

带宽:10Mbps 以上

如果任务非常复杂,推荐更高配。


四、安装基础环境

更新系统:


sudo apt update sudo apt upgrade -y

安装依赖:


sudo apt install -y git python3 python3-venv python3-pip sudo apt install -y chromium-browser

注意:不同系统 chromium 包名称可能不同,可根据系统实际调整。


五、上传 Cerebellum 到服务器(不含任何链接)

将 Cerebellum 项目打包上传到服务器:


scp cerebellum.zip root@服务器IP:/opt/

解压:


cd /opt unzip cerebellum.zip cd cerebellum


六、创建虚拟环境 & 安装依赖


python3 -m venv venv source venv/bin/activate pip install --upgrade pip pip install -r requirements.txt

安装完后,Cerebellum 的所有功能模块基本就准备就绪了。


七、启动 Cerebellum(核心步骤)


source venv/bin/activate python main.py

启动后通常会显示:


Server running at http://0.0.0.0:8000

此时,你可以从浏览器访问:


http://你的服务器IP:8000

即可进入 Cerebellum 的任务面板/UI(如果项目带 WebUI)。

如果是 API 模式,你可以直接通过 POST 请求发送任务。


八、开始使用:让 AI 自动操作浏览器(真实示例)

下面给你一个“真实感觉”的使用流程。


示例 1:登录后台并导出订单

你发送任务:


登录某后台 → 进入订单页 → 导出当天订单 → 下载文件

Cerebellum 会自动:

打开浏览器

进入登录页

检测账号输入框的位置

输入账号密码

点击登录

打开订单列表

选择日期

点击导出

等待下载完成

返回下载文件路径

这相当于一个真正的“自动化员工”。


示例 2:自动采集商品数据

你发送:


访问商品列表 → 抓取所有商品名称和价格 → 输出 JSON

Cerebellum 会自动滚动页面、解析 DOM,最终返回:


[ {"name": "商品A", "price": "198"}, {"name": "商品B", "price": "259"}, ... ]

适合作为小型爬虫,但更稳定、更自然。


示例 3:自动执行复杂测试流程

例如软件测试场景:


按顺序点按钮 → 填写表单 → 跳转 → 下载文档 → 上传结果

AI 会识别页面结构并操作每一步。


九、进阶玩法(让 Cerebellum 更强大)

部署在服务器后,你还能玩出更多花样:

✔ 接入任务队列(如 Celery)

允许同时执行多个浏览器任务。

✔ 加上数据库记录任务状态

适合团队使用。

✔ 加代理池

用于自动化采集、测试更多场景。

✔ 加系统级 API 鉴权

打造企业级自动化服务。

✔ 批量自动化任务

提前定时每天自动跑对应流程。


十、经验总结(非常实用)

chromium 占内存,8GB 是最低门槛

建议使用
tmux

screen
多窗口管理任务

复杂网页建议给 AI 提供更清晰的目标描述

多任务情况下可用 Docker 整合浏览器实例

解析失败时 AI 会自行重试,执行更像真实用户


结语

Cerebellum 是一款让“AI 自动操作浏览器”真正落地的工具。
它比传统自动化框架更智能、更好用,也更适合非开发人员使用。

© 版权声明

相关文章

暂无评论

none
暂无评论...