工作原理
- AI 在特定计算机上打开(或重用)浏览器会话
- 它导航到目标 URL
- 它读取页面内容或截取屏幕
- 它根据需要点击、输入、滚动或等待
- 结果流回到 Thread 中
AI 可以做什么
| 操作 | 描述 |
|---|---|
| 导航 | 转到任何 URL |
| 读取内容 | 获取页面文本(首选,便宜且快速) |
| 截屏 | 捕获可见页面(谨慎使用,成本高) |
| 点击 | 通过 CSS 选择器或 x/y 坐标点击 |
| 输入 | 输入到焦点元素 |
| 滚动 | 向上或向下滚动 |
| 等待 | 暂停最多 10 秒(固定延迟) |
| 读取元素 | 提取交互元素以进行结构化导航,然后使用返回的选择器点击 |
您和 AI 之间的交接
会话是共享的。AI 可以针对您打开的标签页,您也可以从 AI 停止的地方继续。- 您打开标签页。 AI 可以看到它并与之交互。
- AI 打开会话。 在内置浏览器标签页中观看,或通过云会话的实时查看 URL 观看。
- 扩展程序会话。 您的 Chrome 窗口就是 AI 会话。AI 导航您看到的同一浏览器。
AI 使用哪个浏览器
AI 针对特定计算机,这决定了浏览器:- 您的设备 - 内置 Kazzle Browser,或当一个处于活动状态时您连接的 Chrome/Brave 扩展程序会话
- 浏览器计算机 - 云浏览器会话,对于应该在不使用您的设备的情况下继续运行的自动化很有用