So funktioniert es
- Die KI öffnet (oder nutzt wieder) eine Browser-Sitzung auf einem bestimmten Computer
- Sie navigiert zur Ziel-URL
- Sie liest den Seiteninhalt oder macht einen Screenshot
- Sie klickt, tippt, scrollt oder wartet nach Bedarf
- Ergebnisse fließen zurück in den Thread
Was die KI kann
| Aktion | Beschreibung |
|---|---|
| Navigieren | Zu jeder URL gehen |
| Inhalt lesen | Seitentext abrufen (bevorzugt, günstig und schnell) |
| Screenshot | Sichtbare Seite erfassen (sparsam verwenden, teuer) |
| Klicken | Nach CSS-Selektor oder x/y-Koordinaten klicken |
| Tippen | In das fokussierte Element tippen |
| Scrollen | Nach oben oder unten scrollen |
| Warten | Bis zu 10 Sekunden pausieren (feste Verzögerung) |
| Elemente lesen | Interaktive Elemente für strukturierte Navigation extrahieren, dann mit dem zurückgegebenen Selektor klicken |
Übergabe zwischen Ihnen und der KI
Sitzungen werden gemeinsam genutzt. Die KI kann einen Tab ansteuern, den Sie geöffnet haben, und Sie können dort weitermachen, wo die KI aufgehört hat.- Sie öffnen einen Tab. Die KI kann ihn sehen und damit interagieren.
- Die KI öffnet eine Sitzung. Beobachten Sie im integrierten Browser-Tab oder über die Live-View-URL für Cloud-Sitzungen.
- Erweiterungs-Sitzungen. Ihr Chrome-Fenster ist die KI-Sitzung. Die KI navigiert denselben Browser, den Sie sehen.
Welchen Browser die KI verwendet
Die KI zielt auf einen bestimmten Computer ab, und das bestimmt den Browser:- Ihr Gerät – der integrierte Kazzle Browser oder Ihre verbundene Chrome/Brave-Erweiterungs-Sitzung, wenn eine aktiv ist
- Ein Browser-Computer – Cloud-Browser-Sitzungen, nützlich für Automatisierung, die ohne Ihr Gerät weiterlaufen soll