仕組み
- AI は特定のコンピュータ上でブラウザセッションを開く(または再利用する)
- ターゲット URL にナビゲートする
- ページコンテンツを読み込むか、スクリーンショットを撮影する
- 必要に応じてクリック、入力、スクロール、または待機する
- 結果が Thread に流れ込む
AI ができること
| アクション | 説明 |
|---|---|
| ナビゲート | 任意の URL に移動 |
| コンテンツを読む | ページテキストを取得(推奨、安価で高速) |
| スクリーンショット | 表示されているページをキャプチャ(控えめに使用、高コスト) |
| クリック | CSS セレクタまたは x/y 座標でクリック |
| 入力 | フォーカスされた要素に入力 |
| スクロール | 上下にスクロール |
| 待機 | 最大 10 秒間一時停止(固定遅延) |
| 要素を読む | 構造化ナビゲーション用のインタラクティブ要素を抽出し、返されたセレクタでクリック |
あなたと AI 間のハンドオフ
セッションは共有されます。AI はあなたが開いたタブをターゲットにでき、あなたは AI が中断したところから再開できます。- あなたがタブを開く。 AI はそれを見て、相互作用できます。
- AI がセッションを開く。 組み込みブラウザタブで監視するか、クラウドセッションのライブビュー URL 経由で監視します。
- 拡張機能セッション。 あなたの Chrome ウィンドウが AI セッションです。AI はあなたが見ているのと同じブラウザをナビゲートします。
AI が使用するブラウザ
AI は特定のコンピュータをターゲットにし、それがブラウザを決定します。- あなたのデバイス - 組み込み Kazzle Browser、またはアクティブな接続済み Chrome/Brave 拡張機能セッション
- ブラウザコンピュータ - クラウドブラウザセッション、デバイスなしで実行し続ける必要がある自動化に便利